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POLYPEPTIDES IMPLIQUES DANS LA BI^YItoHESE DES COBAI.AMTMPQ 
ET/OU DBS COBAMIDES. SEOP^CES D'ADN OCTANT PflTTW rgg POLYPEPTIDES 
PROCEDE DE PRsfe^TlON. ET LEUR UTILISATION 
La presente invention conceme de noiiveaux polypeptides 
impliques dans la biosynthese :%es cobalamines et/ou des cobamides, et 
en particulier du coenzyme Bj2. Elle conceme egalement le materiel 
genetique responsable de’l'expression de ces polypeptides, ainsi qu'un 
5 precede permettant leur preparation. Elle conceme enfin un precede 
d'amplification de la production de cobalamines, et plus 

particulierement du coenzyme Bij, par les techniques. d'ADN 

recombinant . 

La vitamine B17 fait partie des vitamines du groupe B. 11 
10 s'agit d'une vitamine hydrosoluble qui a ete identifies comme etant le 
f acteur permettant de traiter des malades souf f rant d' anemie 
pernicieuse. Elle est generalement prescrite pour stirauler 
1 ' hematopolese chez les sujets fatigues, mais elle est aussi utilisee 
dans de nombreux autres cas qni comprennent les troubles hepatiques, 
15 des deficiences nerveuses ou comme stimulant de I'appetit, principe 
tonifiant, ainsi qu'en dermatbiogie (Beck, 1982, Fraser et al., 1983). 
Dans les elevages industrielSi d'animaux non ruminants, 1' alimentation 
etant essentiellement a base de proteines d'origines vegetales, il est 
necessaire d'incorporer aux ratiohs alimentaires de la vitamine B12 3 
20 des quantites de TO a 15 mg par tonne d' aliments (Barrere et al., 
1981). 

La vitamine B 12 fait partie d'une classe de molecules 
appelees cobalamines, dont la structure est presentee a la figure 1 . 
Les cobamides different des cobalamines par la base du nucleotide 
qui n'est plus le 5/6—dimethylbenzimidazole, mais une autre 
base, par example, le 5-h^roxybenzimidazole, pour la vitamine 
Bi 2 -f acteur III synthetisee en&e autre par Clostridium thermoaceticum 
Methanosarcina barkeri - (.Iron et al., 1984). Ces similitudes 
structurales expliquent que les voies metaboliques de biosynthese des 
30 cobalamines et des cobamides soient communes pour la ma jeure partie . 

Les cobalamines sont synthetisees presque exclusivement par des 
bacteries, selon un processus complexe et encore tres mal connu, qui 
peut se diviser en quatre etapes (figure 2) : 

i) synthese de I'uroporphyririogene III (ou uro'gen III), 

35 puis 
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ii) transformation de I'uro'gen III en acide cobyrinique 

suivie de 

iii) transformation de celui-ci en cobinamide et 

iv) construction de la boucle nucleotidique inferieure 
5 avec' incorporation de la base particuliere (5,6~dimethylbenzimidazole 

dans le cas des cobalamines) . 

Pour le coepzyme Bx 2 f est probable que 1' addition du 
groupement 5'-deoxy-5'-adenosyl se produit peu apres que le noyau 
corrine soit synthetise (Huennekens et 1892), 

10 Dans le cas des cobamideS/ seule I'etape de synthese et 

d' incorporation de la base inferieure est differente. 

La premiere partie de la biosynthese des cobalamines est 
tres bien connue puisqu'elle est commune a celle des h^es ainsi qu'a 
celle des chlorophylles (Battersby et 1980). Elle fait intervenir 

15 successivement la 6-arainolevulinate synthase (EC 2.3.137), la 
6-aminolevulinate dehydrase (EC 4.2,1.24), la porphobilinogene 
deaminase (EC 4. 3. 1.8) et I'uro'gen III cosynthase (EC 4.2.1.75) qui 
transformant le succinyl CoA et la glycine en uro'gen III. Toutefois 
la premiere etape se fait chez certains organismes [par example E.coli 
20 (Avissar et , 1989) et chez les bacteries methanog^es (Kannangara 
et 1989), par example] par la conversion grace a tin complexe 

multienzymatique de 1' acide glutamique en acide 6-aminolevulinique. 

Entre I'uro^gen III et 1' acide cobyrinique, seuls trois 
derives d'intermediaires ont ete purifies a ce jour ; il s'agit des 
25 Facteurs FI, FII et Fill qui sont des produits d'oxydation 
respectivement des trois intermediaires precorrine-1 , precorrine-2 et 
precorrine«3 qui correspondent aux derives mono-, di- et trimethyles 
de I'uro'gen III (figure 3) ; ces intermediaires sont obtenus par des 
transferts successifs de groupements methyl a partfir du SAM 
30 (S-adenosyl-L-methionine) sur I'uro'gen III aux positions C2, C7 et 
C20 respectivement. Les autres reactions qui ont lieu pour donner 
1' acide cobyrinique sont, outre cinq autres transferts de groupements 
methyl a partir du SAM en C17, C12, Cl, C15 et C5, I'elimination du 
carbone en C20, la decarboxylation en C12 et 1^ insertion d'un atome de 
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cobalt (figure 4). C©s ©tapes de biosynthese ont ete dedoites a partir 
d' experiences effectuees in yitro sitf des extraits acellulaires de 
Propionibacterium sherma nii pu de Clostridium tetahomorphum . Dans ces 
extraits, I'acide cobyrinique est obtenu par transformation de 
5 I'uro'gen 111, apres incubation .dans des conditions appropriees en 
anaerobiose (Batterby et sl.ji; 1982). Aucun intermediaire entre le 
precorrine-3 et I'acide cobyrinique,, poyvaht etre transform© en 
corrinoides par inciabations ulterieures avec des extraits de bacteries 
productrices de cobalamines, n'a ete isole a ce jour chez ces 
10 microorganismes. ' La difficult© d'isoler et d' identifier ces 
intermediaires est lie© a . 

i) leur grande instabilite 

ii ) leur sensibilize a I'oxygene et 

iii) leur faible niveau d'accuinulation in vivo . 

15 Dans cette partie de la vOie, seule luie enzyme de Pseudomonas 
denitrificans a ete purifiee et etudieC; ; ;il s^agit de la SAM:uro'gen 
III methyltransferase (Blanche et al . , 1989) appelee SUMT. 

Entre I'acide cobyrinique et le cobinamide, les reactions 
suivantes sont effectuees : 

20 i) addition du groupement 5 ' -desoxyadenosyl (s'il s'agit 

du coenzyme B12 qui doit etre synthetise), 

ii) amidation de'.six des sept fonctions carboxyliques. par 
addition de groupements amines, 

iii) amidation de la dernier© fonction carboxylique 
25 (chaine d'acide propionigu©: du noyau pyrrole D) par addition du 

R-1-amino-2-propanol (figure 2). 

II n'a pas ete elucide s^i.l existait reellement un ordre 
dans les amidations (Herbert et al., 1970). Enfin, aucun dosage 
d'activite dans cette partie de la voie n'a ete decrit sauf en ce qui 
30 concern© 1' addition du groupement 5 '-desoxyadenosyl (Huennekens et 
al., 1982). 

La demiere etape de la biosynthese d'une cobalamine, par 
example le coenzyme B 12 compyend quatre phases successives decrites 
sur la figure 5 (Huenneltens et al., 1982), a savoir : 

55 i) la phosphorylation du ^groupement hydroxyl du residu 
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ciminopropanol du cobinamide pour donner le cobinamide phosphate, puis 
ii) addition d'une guanosine diphosphate par reaction 
avec la guanosine 5 ' -triphosphate ; le compose =obtenu est le 
GDP-cobinamide (Friedmann, 1975) gui 

5 iii) reagit avec le a-ribazole 5 '-phosphate, lui-meme 

synthetise • a partir de la riboflavine, pour donner I'adenosyl- 
cobalamine 5 '-phosphate (Friedmann et 1968) gui 

iv). par dephosphorylation conduit au coenzyme B 12 
(Schneider et Friedmann, 1972). 

10 Parmi les bacteries capables de produire des cobalamines, 

on peut citer notamment : 

Aarobacterium tumefaciens . 

Aarobacterium radiobacter 
Bacillus meoaterium 

15 Clostridium sticklandii 

Clostridium tetanomorphum 
Clostridium thermoace ticum 
Corvnebacterium XG 
Eubacterium limosm 

20 Methanobacterium arboohilicum 

Methanobacterium ivanovii 
Methanobacterium ruminantium 
Methanobacterim thermoautotronhicum 
Methanosarcina barkeri 

25 Propionobacterim shermanii 

Protaminobacter ruber 
Pseudomonas denitrif icans 
Pseudomonas putida 
Rhizobixom melitoti 
Rhodopseudomonas sphaeroides 
Salmonella tvphimurium 
Spjrulina platensis 
Streptomvces antibioticus 
Streptomvces aureofaciens 



30 
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Streptomvces oriaeus 
Streptomvcgs olivaceus 



5 



10 



15 



,20 



25 



30 



Au niveau industriel, en..raispn de la grande complexite 
des necanismes de biosyntb^e,- la production des cobalamines, et en 
particulier de la vitaminf B i j, est exclusivement microbiologique . 
Elle est realises par des cultures en grands volumes des bact4ries 
Ps eudomonas denitrificans, Propionobacterium shermani i et Propioni - 
baeterium freudenreichii (Plofent> 198d). Les soucbes utilisees pour 
la production industrielle sont Issues de soucbes sauvages; elles 



peuvent avoir subi de- nombreiuc cycles de mutation au hasard puis de 
selection de clones ameliojfds pour la production de cobalamines 
(Florent, 1986). Lps mutations sont obtenues par mutagenese avec des 
agents mutagenes ou par trait^ents physiques tels que des traitements 
aux rayons ultra-violets (Barrere et al., 1981). Par cette methode 
empirique, des mutations aU: vhasard sont obtenues et ameliorent la 
production de cobalamines. .Par exemple^, >1 est decrit gu'a partir de 
la souche originale de- Pseuddmo nas denitrificans initialement isolee 
par Miller et Roaenblum ( 1 96e»|; brevet US ? 938 822) la production de 
ce microorganisme a ete gradhellement augmentee en dix ans, par les 



techniques citees ci-dessus' de 0,6 mg/1 d 60 mg/1 (Florent, 1986). 
Pour les bacteries du genre Propiqnibacterium . [ Propionobacterium 
sh ermanii (ATCC 13673) et freudenreichii fXTrp 6207)] les memes 
valeurs de production Semblentr'etre decrites dans la litterature ; par 
example une production 65 mg/1 a |te decrite (brevet European 
87920). Toutefois, aucun orible n'a encore ete decrit permettant de 
selectionner ou de reperer facilement soit des mutants surproducteurs 
de cobalamines soit dds, mutants nefctement ameliores dans leur 



production de cobalamines. 

Au niveau g^etique, ipeu de travaux ont ete effectues a ce 
jovur. Le clonage de genes (codant pour des enzymes impliquees dans 



le precede de biosynthese) a, ete decrit ehez Bacillus (srey 
et al., 1986). Onze groupes 4b ^complementation ont ete identifies par 
complementation de mutants cob de Baciilus meoatpr j »m avec des 
plasmides portant differents fragments d'^pN de Bacillus meoaterium . 
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Ces genes sont groupes sur le meme locus . porte par un fragment de 
12 kb. 

Des etudes ont egalement ete menees sur les genes cob de 
Salmonella tvphlmurium . Sans que le clonage de ceux-ci ait ete decrit, 
5 il a ete montre que presque tous les genes de biosynthese des 
cobalamines sont regroupes entre les minutes 40 et 42 du chromosome 
(Jeter et Roth, 1987). Seul le locus cvsG . qui doit peirmettre la 
transformation de I'uro'gen III en precorrine-2 ne fait pas partie de 
ce groupe de g^es. Toutefois, I'activite codee par ce locus , ainsi 
10 que ses proprietes biochimiques n'ont pas ete decrites. 

En outre, des phenotypes ont ete associes aux mutations 
safe* Chez Salmonella tvphimurium et chez Bacillus meoaterium . les 
mutants cob ne montrent plus de croissance sur milieu minimum avec de 
I'ethanolamine comme source de carbone ou comme source d' azote (Roof 
15 et Roth, 1988). Ceci est du au fait qu'une enzyme du catabolisme de 
I'ethanolamine, I'ethanolamine ammonia-lyase (EC 4. 3. 1.7), a pour 
cofacteur le coenzyme Bi 2 » les mutants cob ne synthetisant plus de 
coenzyme B 12 , ils ne peuvent plus croitre avec I'ethanolamine comme 
source de carbone et/ou comme source d' azote. Des mutants metE de 
20 Salmonella typhimurium n'ont plus qu'une homocysteine-methyl- 
transferase (EC 2.1.1.13) methylcobalamine dependants. Les mutants cob 
de Salmonella tvp himurium metE sont auxotrophes pour la methionine 
(Jeter et al- » 1984). 

Chez Pseudomonas ~ denitrificans et Aorobaeterium 
25 tumefaciens des phenotypes associes a une deficience totale en 
synthese de cobalamines n'ont pas ete decrits a ce jour. 

Enfin, des travaux sur Pseudomonas denitrificanc; (Cameron 
et al. , 1989) ont abouti au clonage de fragments d'ADN portant des 
genes cob de cette bacterie. Ceux-ci sont repartis en quatre groupes 
30 de complementation portes par au moins 30 kb d'ADN. Au moins quatorze 
groupes de complementation ont ete identifies par complementation 
heterologue de mutants cob d' Aorobaeterium tumefaciens et de 
Pseudomonas putida avec des fragments d'ADN de Pseudomonas 
denitrificans portant des genes cob . 

Cependant, jusqu'a maintenant, aucun de ces g^es n'a ete 



35 
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purifie, et aucune sequence nncleotidi^e ii'a ete decrite. De meme, 

' aucune identification de proteine^ riii aiicnine fonction catalytique 
attribuee au produit de ces gi^^es n'bnt ete decrites. De plus, aucune 
amelioration de production de dobalamines par les techniques d'ADN 
3 recombinant n'a pu Stre obti^ue. L' amplification de genes cob de 
Bacillus meoaterium ne 'procure pas, chez la souche i partir de 
laquelle ils oht ete Clones, une ainilioration de production de 
cobalamines (Brey et , i’986). CheZ Salmonella tvphimurium . des 

etudes physiologiques ont ete menees afin de determiner des conditions 
10 dans lesquelles ;ine forte transcription des genes Cob etudies etait 
observes (Escalante et Roth, 1987). bans ces conditions, il n'y a pas 
d' amelioration de la production de cobalamines, bien' que des genes de 
la voie de biosynthese soien^ plus exprimes que dans les conditions 
standard de culture . 

13 La presente invention resulte de 1' identification precise 

de sequences d'ADN codant pour des polypeptides impliques dans la 
biosynthese des cobalamines' et/ou des cobamides. Un objet de 
1' invention conceme done les s4quehces d'ADN codant pour les 
polypeptides impiiques dans ia bldsynthese des cobalamines et/ou des 
20 cobamides. Plus particulrerement, I'inVention a pour objet les genes 
cobA . cobB . cobC . cob D. cobE ii cob F. cobG . cob H. cobi, cob J. cob K. 
cobL . cobM, cgbN, cob O. cobP, Cob O. cobS . cobT . cob U. cdbv . cobW . cobX 
et cor A . toute sequence d'ADN homologue de ces genes resultant de la 
degen4rescence du code" genetique, aihsi ^e les sequences d'ADN, de 
23 toute origins (naturelie,syhthetique,‘' recombinanbe) qui hybrident 
et/ou qui pr4sentent des hbmplogies significatives avec ces sequences 
ou avec des fragments de celles-ci et qhi'^COdent pour des polypeptides 
impliques dans la biosynthe^ des cobalamines et/ou des cobamides. 
L' invention a aussi pour objet' les genes contenant ces sequences 
30 d'ADN. 

Les sequences d'ADN selon la presente invention ont ete 
isblees a partir de differentes soucti’es : une souche industrielle. 
Pseudomonas denitrificans SC510. derived de la souche MB580 (brevet US 
3 018 225), par complementation de mutants cob de A.tumefaciens et 
P.putida ; et de Methahobacterium ivanovii . Les clones obtenus ont pu 



35 
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etre analyses preclsement, notanunent par cartographie a I'aide 
d' insertions d'un derive du transposon TnS. Ces etudes genetiques ont 
permis de localiser les genes cob ou cor sur la carte de restriction 
et de realiser leur seguengage. Une analyse des phases ouvertes a 
5 ensuite permis de mettre en evidence les regions codantes de ces 
fragments d'ADN. 

La presente invention a aussi pour objet I'utilisation de 
ces sequences nucleotidiques pour doner les genes cob d'autres 
bacteries. En effet il est connu que pour des proteines catalysant les 
10 memes activites, les sequences sont conservees avec, coitime divergence, 
la divergence evolutive (Wein-Hsiung et d., 1985). Il est montre dans 
la presente invention qu'il y a une homologie significative entre les 
sequences nucleotidiques de genes de differents microorganismes codant 
pour des polypeptides impliques dans la biosynthese des cobalamines 
15 et/ou des cobamides. Les differences qui apparaissent resultant de la 
degenerescence evolutive, et de la degenerescence du code genitique 
qui est liee au pourcentage en GC du genome du microorganisme etudie 
(Wein-Hsiung et al., 1985). 

Selon la presente invention, une sonde peut etre faite 
20 avec une ou plusieurs des sequences d' AON de Pseudomonas denitrifirans 
notamment, ou avec des fragments de cel les -ci, ou avec des sequences 
analogues presentant un degre de degenerescence specif ique, au niveau 
de 1' usage des codons et du pourcentage en GC de I'ADN de la bacteria 
que I'on veut etudier. Dans ces conditions, il est possible de 
25 detecter un signal d' hybridation specif ique entre la sonde et des 
fragments d'ADN genomique de la bacteria etudiee ; ce signal 
d' hybridation specif ique correspond a 1' hybridation de la sonde avec 
les genes cob isofonctionnels de la bacteria. Les genes cob ainsi que 
leurs produits peuvent ensuite etre isoles, purifies et caracterises . 
30 1' invention foumit ainsi un moyen permettant, par hybridation, 

d'acceder aux sequences nucleotidiques et aux polypeptides impliques 
dans la biosynthese des cobalamines et/ou des cobamides de tout 
microorganisme . 

La presente invention a egalement pour objet un ADN 
35 recombinant contenant au moins une sequence d'ADN codant pour un 




wo 91/11518 



PCT/FR91/00054 



9 

polypeptide implique dans la biosynthese des cobalamines et/ou des 
cobamides, et notamment, ud ADN recombinant dans lequel la ou lesdites 
sequences sont placees sous le controls de siqnaux d' expression. 

A cet egard, bn pbut en particulier positiohner en 5' de 
5 la sequence d'AON des regions promotrices. De telles regions peuvent 
etre homologues ou heterblogu^ de la sequence d'AON. En particulier, 
des promoteurs bacteriens forts, fels-que le promoteur de I'operon 
tryptophane P trp ou de I'opSron lactose Plac de E.eoli . le promoteur 
gauche ou droit du bacteriophage lambda, les promoteurs forts de 
10 phages de bacteries, telles .^e les corvnebacteries . les promoteurs 
fonctionnels chez les bacteries gram-negatives,- tel que le promoteur 
Ptac de E.eoli. le promoteur P xvlS des genes du catabolisrae du xylene 
du plasmide T01>, le promoteur de I'aniylase de Baeillug *^nhtilis Pamv . 
pourront etre utilises. On peut citer egalement les promoteurs derives 
15 de genes glycolytiques de leviires, tels que les promoteurs des genes 
codant pour le phosphoglycerate kinase, la glyceraldehyde-3-phosphate 
deshydrogenase , la lactase ou I'raolase, qui pourront etre utilises 
lorsque I'ADN recombinant sera introduit dans un h5te eucaryote. On 
site de fixation des ribosomes sera egalement positionne en 5' de la 
20 sequence d'AON et il pourra §tre homologue'ou heterologue, tel le site 
de fixation des ribosomes du gene cl I du bacteriophage lambda. 

Des signaux necessaires a la terminaison de la trans- 
cription pourront etre places en 3' de la sequence d'AON. 

L' AON recombinant selon la presente invention peut ensuite 
25 etre introduit directement dans une cellule hote compatible avec les 
signaux d' expression choisis ou etre' clone sur un vecteur plasmidique 
pour permettre d'iiitrbduire de manidfe stable la sequence d'AON en 
question dans la cellule hote. 

Un autre ob jet de I'inventtoii'conceme les plasmides ainsi 
30 obtenus contenant une sequence d'ADN codant pour un polypeptide 
implique dans la biosynthese des cbbalamihes et/ou des cobamides. Plus 
precisement, ces plasmides contienhent aussi im systems de replication 
fonctionnel et un marqueur de selection. 

L' invention a aussi pour objet les cellules hotes dans 
35 lesquelles line ou plusieurs sequences ' d'AON telles que definies 




wo 91/11518 



PCT/FR91/00054 



10 

precedenunent, ou un plasmids tel que defini ci-avant, a 4t4 introduit. 

Un autre objet de 1' invention conceme un precede de 
production de polypeptides impliques dans la biosynthese des 
cobalamines et/ou des cobamides. Selon ce proc^e,ntrointroduit dans 
5 une cellule hote une sequence d'ADN telle que decrite precedenunent, on 
cultive cette cellule recombinante dans des conditions d' expression de 
ladite sequence, puis on recup&re les polypeptides produits. 

Les cellules botes qui pourront etre utilisees dans ce but 
sont aussi bien des procaryotes que des eucaryotes, des cellules 
10 animales ou des celliiles vegetales. Preferentiellement, elles seront 
choisies parmi les bacteries et, en particulier, les bacteries du 
genre E.coli . P . denitr if icans . A.tumefaciens ou R.melitoti . 

Une autre utilisation des sequences d'ADN selon la 
pr4sente invention reside dans un precede d' amplification de la 
15 production de cobalamines et/ou de cobamides ou de leurs precurseurs 
de biosynthese, par les techniques d'ADN recombinant. En effet, si la 
limitation du flux metabolique de la biosynthese des cobalamines et/ou 
des cobamides ou de leurs precurseurs est due a une limitation dans 
I'activite d'une enzyme dans la voie de biosynthese, 1' augmentation de 
20 cette activite par augmentation de 1' expression de cette mime enzyme a 
I'aide des techniques d'ADN recombinant (amplification genique, 
substitution des signaux de transcript ion- traduction par des signaux 
plus ef f icaces . . . ) conduira a une augmentation de la biosynthese des 
cobalamines et/ou des cobamides. II est possible egalement que la 
25 limitation de la production de cobalamines et/ou de cobamides resulte 
d'une regulation biochimique. Dans ce cas, le ou les genes cob 
correspondent a 1' enzyme regulee pourront etre mutagenises in vitro 
specif iquement afin d'obtenir des genes mutes dont les produits auront 
perdu les regulations allant a I'encontre d'une amelioration de la 
30 production. 

Le precede selon la presente: invention consiste a 

introduire dans un microorganisms producteur de cobalamines et/ou de 
cobamides, ou seulement potentiellement producteur de ces composes 
(e'est-d-dire deficient dans une ou plusieiurs des etapes de la 
biosynthese), une sequence d'ADN telle que definie plus haut, puis a 
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cultiver ce microorgani^kinfe daiis des conditions d' expression de ladite 
sequence et de synth&e des fcobalamines et/ou des cobcunides, et enfin 
a recuperer les cobalamxnes'‘ et/ou les ^bamides ’ produits . Un tel 
precede est applicable en particulier tous les microorqanismes 
5 producteurs cites page^' 4, et plus specif z^ement aux microorganismes 
du genre P. denitrificans , Rhizobium melitoti . ' ou Aqrobacterium 
tumef aciens . Dans un mode de realisation pref ere, le microorganisme 
est Pj. denitrificans , et en particulier, la souche SC510. Concemant 
les microorganismes potentieileinOTt p'roducteiirs, les sequences d'ADN 
10 utilisees seront celles correspohdant aux etapes de la biosynthese que 
le microorganisme ne peut realiser. 

A I'aide de la'7pr4sente' invention et par les di verses 

•••■' r‘ 

strategies exposees ci-dessus, une amelioration de la production de 
cobalamines et/ ou de cobamides ou de leurs precurseurs pour tout 
15 microorganisme producteur , : ou potentiellement producteur, de 

cobalamines et/ou de cobamides, pourra etre obtenue, II suffira de 
cultiver ce microorganisme recombine daps des conditions appropriees 
pour la production de. cobalamines et p>oujr' 1' expression des sequences 
d'ADN introduites. Cette culture pourra se faire en batch ou bien en 
20 continu, et la purification des cobalamines pourra se faire par les 
methodes dejS utilisees au -niveau indttsiriel (Florent, 1986). Ces 
methodes compreiuient Ventre autre : 

i) la solubilisation des cobalamines et leur conversion en 
leur forme cyano (par example eh traitant le mout de fermentation a la 

25 chaleur, avec du cyanurp de- potassium aa presence de nitrite de 
sodium), puis -- 

ii) la purification des cyanocobalamines en differentes 
etapes qui peuvent etre pa^'fxemple 

a) I'adsorption sur differepts substrats tels que I'amberlite IRC50, 
30 le Dowex 1X2 ou I'amberlite lUD- 2 suivie d'une 4lution avec un melange 

eau-alcool ou eau ph&iol, ^^utS' . 

b) 1' extraction dans un sOlvant organique et enfin 

c) la precipitation ou cristallisation a partir de la phase organique 
soit par addition de reactifs ou dilution dans un solvant approprie, 
soit par evaporation.- 
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La presente invention montre de plus qu'il est possible, 
par les techniques d'ADN recombinant, d^ameliorer la production de 
cobalamines d'tme bacterie productrice de cobalamines en cumulant des 
ameliorations. Ceci revient a obtenir \me premiere amelioration comme 
5 cela est decrit ci-dessus puis a ameliorer cette amelioration toujours 
a I'aide des techniques d'ADN recombinant, c'est-a-dire par example en 
amplifiant des genes de biosynthese des cobalamines. 

Un autre objet de la presente invention conceme les 
polypeptides impliques dans la biosynthese des cobalamines et/ou des 
10 cobamides. En particulier, la presente invention a pour objet tous les 
polypeptides, ou des derives ou des fragments de ces polypeptides, qui 
sont codes par les sequences d'ADN decrites precedemment, et qui sont 
impliques dans la voie de biosynthese des cobalamines et/ou des 
cobamides . La sequence en acides amines de ces polypeptides est 
15 decrite, ainsi que certaines de leurs caracteristiques 

physicochimiques . Une activite enzymatique ou des proprietes 
specif iques ont egalement ete associees a chacun d'entre-eux. 

A cet egard, 1' invention a pour objet les polypeptides 
intervenant dans la transformation du precorrine-3 en acide 
20 cobyrinique a,c-diaraide, et plus particulierement dans le transfert 
d'un groupement methyl du SAM aux positions Ci/ C5, C11, Cl 5, et Cl 7. 
L' invention a aussi pour objet les polypeptide: 

. intervenant dans la transformation de 1' acide cobyrique 
en cobinamide, ou 

25 . possedant une activite 

S-adenosyl-L-methionine:precorrine-2 methyl transferase (SP2MT), ou 

. possedant une activite acide cobyrinique et/ou 
hydrogenobyrinique a,c-diamide synthase, ou 

. possedant une activite precorrin-8x mutase, ou 
30 . possedant une activite nicotinate-nucleotide : 

dime thy Ibenz imidazole phosphoribosyltransf erase, ou 

. possedant une activite cobalamine-tS' -phosphate) 

synthase, ou 

• possedant une activite cobyric acid synthase, ou 
. possedant une activite cob(I)alamin adenosyltransf erase. 
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ou : ^ . 

. possedant one adtivite"precorrin-6x reductase, ou 
• interv&iant dans la transforniation de I'acide 
hydrog&iobyrinique a,c-diamide en acid# cobyrinique a,c-diamide. 

5 Avantageusement, 1' invention .la pour objet un polypeptide 

choisi parmi les proteines COBA, COBB, COBC,COBD, COBB, COBF, COBG, 
COBH, COBI, COBJ, COBK, COBt, COBM, COBN, COBO, COBP, COBQ, COBS, 
COST, COBU, COBV, COBW, COBX et CORA pr4sentees aux figures 15, 16, 
40, 41 et 47. .1 

iO De plus, I'utilisation des sondes d'hybridation decrites 

precedenunent permet, a partir de genes isoles dans d'autres 
ffiicroorganismes, de caractSriser et d'isoler les polypeptides 
isofonctlonnels d'autres ; mij^oorganismes. De cette maniere, la 
presente invention montre gue" ia sequence d'une proteine COB de 

15 Pseudomonas denitrificans est significativement homologue aux 

sequences de proteines d'autres microorganismes presentant le meme 
type d'activite. Entire ces proteines COB catalysant la meme reaction 
Chez des microorganismes differents, seules les distances evolutives 
ont introduit des variations ^Iffein-HSiimg et ai . , 1985). La presente 
20 invention a egalement pour objet ces polypeptides isof onctionnels . 

L' attribution d'une activity enzymatique particuliere est 
le risultat d'une analyse qui peut §tre effectuee selon diverses 
strategies. En particulier, d#s etudes d'affinite in vitro , vis-a-vis 
du SAM (S-adenbsyl-L-methibhine), pennettent d'attribuer a une 
25 proteine capable de fixer le SAM, une activity mbthyltransf erase, et 
done son implication dans urie des 4tap4s de transfert des groupements 
m4thyl qui se produisent aitre I'uro'gen.ill et I'acide cobyrinique. 
Un autre moyen d'apprecier l'activit4 de ces polypeptides consists a 
doser les interm4diaires de la voie de bioSynthese des cobalamines qui 
30 sont accumul4s chez des mutant's incapables d' exprimer ces polypeptides 
(identifi4s par des exp4riences de complementation). Ces analyses 
permettent.de d4duire que le .^lypeptide en question a pour substrat 
1 ' inteirm4diaire accdi&l4, ce' '^i permet de situer et de d4finir son 
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activite dans la voie de biosynthese. La presente invention deer it 
egalement un precede de dosage des activites enzymatigues de la voie 
de biosynthese, applicable a toute souche productrice de cobalamines 
et/ou de cobamides. Ces dosages permettent de purifier a partir de 
3 toute souche productrice de ces composes, 1' activite enzymatigue 
dosee. A partir de cette activite purifiee, la sequence NH2-terminale 
de la proteine COB en question, ou bien celle des sous-imites de cette 
proteine, peut etre effectuee, ce qui permet d' identifier le ou les 
g^es de structure qui codent pour 1' activite en question. Pour 
10 Pseudomonas denitrificans ; les genes de structure qui codent pour des 
activites de la voie de biosynthese sont identifies en trouvant pour 
cheque sequence NH2-terminale, la proteine COB ay ant la meme sequence 
NH2-terminale . 

La presente invention decrit aussi un precede permettant 
15 1' identification et le dosage, chez des souches productrices de 

cobalamines ou des mutants non producteurs, d'intermediaires de la 
voie de biosynthese des cobalamines ou d'autres corrinoides, Ces 
intermediaires peuvent etre doses aussi bien dans des mouts de culture 
que dans les cellules elles-m&nes. Les intermediaires qui peuvent etre 
20 doses sont tous les corrinoides qui se trouvent dans la voie de 
biosynthese apres I'acide cobyrinique a savoir outre I'acide 
cobyrinique, I'acide cobyrinique monoamide , I'acide cobyrinique 
diamide, I'acide cobyrinique triamide, I'acide cobyrinique tetraamide, 
I'acide cobyrinique pentaamide, I'acide cobyrique, le cobinamide, le 
25 cobinamide phosphate, le GDP-cobinamide, le coenzyme Bi 2 -p^osphate et 
le coenzyme Bi 2 * Les formes cyano et coenzyme de ces produits peuvent 
etre dosees par cette technique, 

D^autres objets et avantages de la presente invention 
apparaitront a la lectxire des examples et des dessins suivants, qui 
30 doivent etre consideres comme illustratifs et non limitatifs, 

DEFINITION DES TERMES EMPLOYES ET ABREVIATIONS 

ACDAS: acide cobyrinique a,c>diamide synthase . 

ADN recombinant: ensemble de techniques qui permettent soit d'associer 
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au sein du mime microorganisme des sequences d'ADN gui ne le sent pas 
naturellement, soit de mutageniser speciflquement vin fragment d'ADN. 
ATP: adenosine 5 ' -triphosphate; 

BSA: seriun albumine bovine 

5 CLHP: Chromatographie liquide a haiute performance, 
cluster: groups de gines. 

Cob: correspond au phenotype de niveau reduit (au moins 10 fois moins 
que le contrile) de production; de cobalamines. 

Codon stop: codon de terminaisOn de traduction 
10 Corrinoides : derives de I'acide cobyrihique possedant le noyau 

corrine. 

dGTP: 2'-desoxyguanosine 5 ' -triphosphate 
DMBI: dimethylbenz imidazole 

dNTP : 2 ' -desoxyribonucleosides : 5 ' -triphosphates 
15 DTT: dithiothreitol 

gene cob: gene implique dans la biosynthese du cobinamide a partir de 
I'uro'gen III. 

gene cor: gene implique dans^ la biosynthise des corrinoides a partir 
de I'uro'gen III. v, 

20 kb: kilobases 
NN:DMBI PRT : 

ORF: phase ouverte 
pb: paires de bases 

Proteins COB: proteine intervenant soit comme catalyseur dans la voie 
25 de biosynthese des cobalamines, soit coime proteine regula trice dans 
le reseau de regulation des gi^es cob, soit les deux. 

Proteine COR: proteine intervenant sdit comme catalyseur dans la voie 
de biosynthese des corrinoides, soit comme ’proteine regulatrice dans 

• ‘ V- . , ' '■’< ' 

le reseau de regulation des <i^es cor, soit les deux. 

30 SAM: S-adenosyl-L-methioninei' ' 

SDS: sodium dodecyl sulfate 

SP2MT: SAH-Ij-methionine:precorrine-2 methyltransferase 
SUMT: SAM:uro'gen III methyltransferase ~ 

Uro'gen III: uroporphyrinog^e III. 
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Legendes des figures: 

Figure 1 : 

Structure du coenzyme B12; le groupement 5'-deoxyadenosyl est remplace 
par un groupement CH3 pour la methylcobalamine, par un groupement 
5 cyano pour la cyanocobalamine, par un groupement hydroxyl pour 
1 ' hydroxocobalamine . 

Figure 2: 

Biosynthese des cobalamines et differentes etapes de cette biosyn these 
suivant la litterature. X: ligands axiaux du cobalt; le ligand en a 
10 peut etre different du ligand en b. R: ligand en a du cobalt gui 
def init le type de cobalamine (voir figure 1 ) • 

Figure 3: 

Structures de I'uro'gen III, du precorrine-1 , du precorrine-2 et du 
precorrine-3 . 

15 Figure 4: 

Formules developpees de I'uro'gen III et de I'acide cobyrinigue. 
D'apres la litterature, entre I'uro'gen III et I'acide cobyrinigue il 
se produit 8 transferts de methyles SAM-dependants successivement en 
C2, C7, C20, C17, C12, Cl, CIS et C5, une decarboxylation en C12, 
20 I'elimination du carbone en C20 et I'insertion de I'atorae de cobalt. 
X: ligands axiaux du cobalt; le ligand en a peut etre different du 
ligand en b. 

Figure 5 : 

Dernieres etapes de la biosynthese des cobalamines. Afin de clarifier 
23 le schema des details du noyau corrine ont ete omis. Les cing etapes 
enzymatigues sont representees: 1, cobinamide kinase; 2, cobinamide 
phosphate guanylyltransf erase; 3, cobalamine 5^ -phosphate synthase; 4, 
cobalamine 5 ' -phosphate phosphohydrolase ; 5 , nicotinate 

nucleotide: DMBI phosphor ibosyl transferase . 

30 Figure 6 : Cartes de restriction des fragments 

Clal- Hind lll- Hind lll- Hind lll de 5.4 kb; EcoRI de 8.7 kb; 
Sal l- Sal l- Sal l- Sal l- Sal l- Bgl l de 4748 pb et Sstl-Sstl-BamHI de 

3855 pb . Ne f igurent gue les 20 enzymes de restriction gui 

coupent le moins freguemment I'ADN. Les sites de coupure de chague 
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enzyme sent iiuiiques par un trait vertical. 

Figure 7: 

Sequence nucleotidique des deux brins du fragment 
Clal-Hindlll-Hindlll-Hindlll 5376 pb de^' Pseudomonas denitrif leans. 
5 Le brin situe en haut est a lire 5' vers 3' dans le sens gauche droite 
gui correspond a 1 'orientation gauche 4foite du fragment de la carte 
de restriction presentee k la figure 6. Le site Clal se trouve a 
la position 23 Idebut du sit^ de coupure) car sur cette sequence se 

trouvent des sites de restrictioh PstI, Sail et Xbal qui spnt appanis 

* ■ 

10 lors des clonages dans des ’ multisites en vue du sequengage. La 
sequence du fragment ClaI- Hind III- Hind lII >Hind IlI commence done a la 
position 23. 

Figure 8: _ 

Sequence nucleotidique des deux brins du fragment EcoRI de 8753 pb de 
15 Pseudomonas denitrif leans. Le b^rin situe en haut est a lire 5' vers 3' 
dans le sens gauche droite , qui .pqrrespond , a 1 ' orientation 
gauche-droite du fragment de la carte de restriction presentee a la 
figure 6. 

"Figure 9: 

20 Analyse des probedsilites des j^ases codantes d'apres. usage des codons 
en utilisant le programmev^de. Staden et HacLachlan (1982) sur les 6 
phases de lecture de la .sequence du fragment 
Cla l- Hind lll- HindJ II- Hind lll ,„de 5378 pb. Pour les phases qui 
appartiennent au meme brin ’:codant^ ,1a phase la plus probable 
23 correspond a celle ou une li^e pointillee^ non interrompue par des 
codons stop, est plagee sous laligne de probabilite de cette phase. 

1. Sequence ,alla^ dp nucleotide 1' au nucleotide 1200. 

Grace a cette analyse, la V^^e ouverte 1 est identifiee. Elle 

commence a I'ATG en position 549 et se termine au TGA en position 

30 1011. 

2. Sequence allanf^.du nucleotide .1000 au nucleotide 2200. 

Grace a cette analyse, la phase ouVerte 2 est identifiee. Elle 

commence a I'ATG en position 1141 et^ se termine au TGA en position 
1981. 

3. Sequence allant . du nucleptfde 1800 au nucleotide 3400. 
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Grace a cette analyse, la phase ouverte 3 est identifiee. Elle 
- commence a I'ATG en position 1980 et se termine au TGA en position 
3282. 

4. Sequence allant du nucleotide 3000 au nucleotide 4500. 
3 Grace a cette analyse, la phase ouverte ouverte 4 est identifies. Elle 

commence a I'ATG en position 3281 et se termine au TGA en position 
4280. 

5. Sequence allant du nucleotide 3800 au nucleotide 5378. 
Grace a cette analyse, la phase ouverte 5 est identifiee. Elle 

10 commence au GTG en position 4284 et se termine au TGA en position 
5253. 

Figure 10: 

. Analyse des probabilitis des phases codantes d'apres usage des codons 
en utilisant le programme de Staden et HacLachlan (1982) sur les 6 
15 phases de lecture du fragment EcoRI de 8753 pb. Four les phases qui 
appartiennent au m&ne brin codant, la phase la plus probable 
correspond a celle ou une ligne pointillee, non interrompue par des 
codons stop, est plagee sous la ligne de probabilite de cette phase. 

1. Sequence allant du nucleotide 650 au nucleotide 1650. 

20 Grace a cette analyse, la phase ouverte 6 est identifiee. Elle 

commence a I'ATG en position 736 et se termine au TAG en position 
1519. 

2. Sequence allant du nucleotide 1400 au nucleotide 3100. 

Grace a cette analyse, la phase ouverte 7 est identifiee. Elle 

25 commence a I'ATG en position 1620 et se termine au TAG en position 
2997. 

3. Sequence allant du nucleotide 2700 au nucleotide 3700. 

Grace a cette analyse, la phase ouverte 8 est identifiee. Elle 

commence a I'ATG en position 3002 et se termine au TGA en position 

30 3632. 

4. Sequence allant du nucleotide 3500 au nucleotide 4100. 

Grace a cette analyse, la phase ouverte 9 est identifiee. Elle 

commence au GTG en position 3631 et se termine au TGA en position 
4366. 

35 5. Sequence allant du nucleotide 4150 au nucleotide 5150. 




wo 91/11518 



PCT/FR91/000S4 



• 



19 

Grace S cette analyse, la phase ouverte 10 est identifiee. Elle 

commence a I'ATG en position 4365 et se termine au TGA en position 
5127. 

6. Sequ^ce allaht. du nucleotide 5000 au nucleotide 6000. 

5 Grace a cette analyse, la phase ouverte 1 1 est identifiee. Elle 

commence a I'ATG ea positiofas 5:893 «t se, termine au TAG en position 
5110. ^ ■ ' 

7. Sequence allant du nucleotide 5700 au nucleotide 7200. 
Grace a cette analyse, la c^se 12 est identifiee. Elle commence a 

10 I'ATG en positi<»i 5662 et se termine au TAA en position 7101. 

8. Sequence sllant du nucleotide 7000 au nucleotide 8000. 

Grace a cette analyse, la fphase ouverte 13 est identifies. Elle 

commence a I'ATG en position 7172 et se termine au TTG en position 
7931. 

15 Figure 11: 

Construction des plasmides pXL556, ,.pXI,545 et pXL723. On fragment 
Clal-EcoRV de 2:4 kb contenant les genes cobA et cobE est excise du 
fragment de 5,4 kb puis pnri£ie. Un "linker” EcoRl est ajoute au site 
EcoRV, puis le fragment est} insere dans le pXL59 entre les sites 
20 Clal-EcoRI. Le plasmide ainsi oonstruit est nomme pXL556. La 
construction est comparable pour le pXL545 : un fragment 

Clal-Hindlll-Hindlll de 1.9 kb est excise du fragment de 5,4 kb puis 
purifie. Ce fragment contii^i uniquement le gene CobE. On "linker" 
EcoRI est ajoute au site H-indlll, puis le fragment est insere dans le 
25 pXL59 entre les sites dal-EcoRl. 

Le pXL723 est construi't comme suit: un fragment EcoRl-Hindlll de 2.3 
kb est excise du fragment de 5,4 kb, pjirifie, puis les extremites sont 
remplies par le grand fragment ^de l'ADN polymerase I de E. coli. Ce 
fragment est clone dans le pRK290 -(pitta et al., 1981) digere par 
30 EcoRI puis traite avec le lai^e' £ragm^t.::de I'ADN polymerase 1 de E. 
coli afin de remplir leS extremites. LeS sites de restrictions qui 
sont figures entre parent^i^e correspondent S des sites qui ont 
dispani apres traitement iavec le largeiifragment de I'ADN polymerase I 
de E. coli. 

1 , fragment Pstl-SstI de RSF1010 |.|De Graff et al., 1978); 2, 
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fragment Fstl-BamHI de pACYC177 (Bagdasarian et al., 1981); 3, 

fragment BamHi-SstI contenant I'operon lactose de E. coli sans son 
promoteur, l'operate\ir, le site d' initiation de la traduction et les 8 
premiers codons non essentiels de lacZ (Casadaban et al.,1983); 4, 
3 fragment Sau3Al de Pseudomonas putida KT2440 (Bagdasarian et al., 
1981); ori, origine de replication; nic, site de relaxation; mob , 
locus essential pour la mobilisation; Kmr gen-e de resistance a la 
kanamycine (Bagdasarian et al., 1981); B, BamKI; C, Clal; E, EcoRI; H, 
Hindlll; P, PstI; S, SstI; Sa, Sail; X, Xhol; Xb, Xbal. 

10 Figure 12: 

Etudes des insertions des transposons TnSSpr et Tn5 sur le fragment de 
5378 bp. Les insertions du transposon Tn5 sur le plasmide pXL723 sont 
figurees comme a la figure 14; celles du transposon TnSSpr, dans le 
chromosome de la souche SBL27 Rifr, sont encadrees; les insertions 
15 dans le chromosome de SC510 Rifr de cassettes portant le gene de 
resistance a la kanamycine (1630 et 1631) sont representees avec tme 
fleche, selon 1' orientation de la transcription du g^e de resistance 
a la kanamycine, sous le nuraero de 1' insertion. Les phases ouvertes 
deduites de la sequence sont portees sur cette figure (de cobA a 
20 cobs); des signes ou - sont reprSsentes sous chague insertion de 
transposon ou de cassette de resistance pour indiquer gue 1' insertion 
est inactivationnelle (-) ou non (-f) soit pour la complementation de 
differents mutants (cas des insertions de transposons Tn5) ou gue 
1' insertion abolit la production de cobalamines de la souche dans 
laguelle elle a lieu. II y a une absence de complementation lorsgue le 
mutant recombine synthetise moins de trois fois moins de cobalamines 
gue le niveau de synthese de la souche dont le mutant derive. Les 
inserts des plasmides pXL545Q, pXLISOO, pXL1397 et pXL302 sont 
representes avec les sites de restriction se trouvant a leurs 
extremites. Ces inserts sont clones dans les plasmides a large spectre 
d'hote pXL435 et pXL59 (Cameron et al., 1989). 

Le plasmide pXL545fi correspond au plasmide pXL545 decrit a la figure 
11 avec en plus le fragment BamHi de 2 kb du pHP45Q (Prentki et 
Krisch) contenant un gene de resistance a la spectinomycine clone au 
site BamHI du pXL545. 
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Le plasmide pXLISOO correspond au fragment Bglll-SstI de 4.2 kb 
presente s\ar cette figure clone aux sites BamHI et SstI du pKT230 
(Bagdasarian et al., 1981) presente a la figxjre 30; le pXL1397 
correspond au fragment Hindlil-SstI de 2.4 kb designe sur la figure 
5 insere entre les sites Hindlll et Ssti du multisite du pXL435 (Cameron 
et al., 1989) ddcrit sur la figure 30; le plasmide pXL302 correspond 
au fragment EcoRI-Hindlll de 2.3 kb tel qu'il est decrit sur la figure 
insere entre les site EcoRI et Hindlll du pXL59 (Cameron et al., 
1989), decrit sur la figure 30, le site Hindlll utilise etant le site 
10 se trouvant dans, le multisi^e de clbnage du pXL59; le pXL723 est 
decrit i la figure 11 tout comihe le pXL'545. 

Des signes + ou ~ sont representes au dessus de cbacun de ces inserts 
pour indiguer s'il y a complementation par le plasmide eii question des 
insertions chromosomiques representees au-desssus. C, Clal; E, EcoRl; 
15 H, Hindlll; RV, EcoRV; Sau, Sau3Al; S, Ssti. 

Figure 13: 

Construction des plasmides pXL253 et pXL367. Le fragment EcoRl de 8.7 
kb est excise puis purifie a partir du plasmide pXL151. 11 est clone 
au site EcoRl du pKT230 pour doniier le pXL253. Ce meme fragment est 
20 insert au site EcoRl du pHl^W'(Ditta et al., 1981) pour dormer le 
pXL367. 1, fragment Pstl-Sstl 'de RSF1010 (De Graff et al., 1978); 2, 
fragment Pstl-BamHl de pACYC177 (Bagdasarian et al., 1981); ori, 
origine de replication; nic, site de relaxation; mob , locus essentiel 
-pour la mobilisation (Bagdasarian et al., 1981); B, BamHI; C, Clal; 
25 E, EcoRl; H, Hindlll; P, Psti; S, Ssti; Sa, Sail; X, Xhol; Xb, Xbal; 
tetr g«ie de risistance a la tetracycline; Kmr , gdne de resistance a 
la kaiuunycine. 

Figure 14: 

Etudes des insertions des tri^posons TnSlacZ et Tn5 sur le fragment 
50 ecoRI de 8.7 kb clone dans pRK29() (Ditta et al, 1980). Les insertions 
des transposons TnSlacZ sont soulignees au contraire de celles des 
transposons Tn5, Les phases ouvertes deduites de la sequence (cobF a 
cobM) sont portees sur cette figure et les huit groupes d' Insertions 
inactivationnelles (numerotes d® i a 8 sont presentes; des signes + ou 
- sont representes sous chaque insertion de transposon pour indiguer 
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que 1' insertion est inactivationnelle (-) ou non ( + ) pour la 

complementation de differents mutants). II y a line absence de 

complementation lorsgue le mutant recombine synthetis'e moins de trois 
fois moins de vitamine B12 que le niveau de synthese de la souche dont 
5 le mutant derive. Ces groupes d' insertions inactivationnelles 
correspondent aiix mutants suivants: 1, G615; 2, G614 et G616; 3, G613 
et G164; 4, G620; 5, G638; 6, G610 et G609; 7, G612; 8, G611, Ces 

mutants sont des mutants Cob d' Agrobacterium tumefaciens deja decrits 
(Cameron et al, 1989). Une carte de restriction du fragment de 8.7 kb 
10 est portee au bas de la figure. 

Figure 15: 

Les sequences codantes de chacun des genes du fragment de 5,4 kb, 
respectivement cobA a cobE, sont indiquees. La sequence des proteines 
COBA a COBE codees par ces sequences figurent sous leur sequence 

15 codante respective, cobA a cobE. la composition en acides amines de 
cheque proteine, en nombre et en pourcentage, respectivement de COBA a 
COBE, sont presentees ainsi que le poids moleculaire, 1' index de 
polarite, le point isoelectrique, la densite optique a 260 nm et a 280 
nm d'une solution a 1 mg/ml de proteine purifiee. Le profil 
20 d'hydrophilicite de cheque proteine, respectivement de COBA a COBE, 
est represente; il a ete calcule d'^apres le programme de Hopp et 
Woods (1981). Les valeurs positives correspondent a des regions de la 
proteine qui sont hydrophiles. En abscisse la position des acides 
amines est indiquee tandis qu^en ordonnee la valeur de 1' index 
25 d'hydrophilicite est figures; lorsque cette valeur est positive, cela 
indique que la region de la proteine est hydrophile. 

Figure 16: 

Les sequences codantes de chacian des genes du fragment de 8,7 kb, 
respectivement cobF a cobM, sont indiquees. Les sequences des 
30 proteines COBF a COBM codees par ces sequences, figurent sous leur 
sequence. La legende est identique a celle de la figure 15. NB. Nous 
avons fait commencer la proteine COBF a I'ATG situe a la position 736; 
il est possible que I'ATG situe a la position 751 soit le veritable 
codon d' initiation de cette proteine. 

Figure 17: 
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Reaction catalysee par I'acide cobyrinic^e .a,c-diamide synthase. 
L'ACDAS catalyse I'amidation des f onc|;,ions acides carboxyligues des 
chaines acetate periph4ri<|U(^ . a :^t c de I'acide cobyrinigue 
(hydrogenobyrinigue) poor . donner I'acide cobyrinigue diamide 
3 (hydrogenobyrinigue diamide) ,le donneur du groupement amine utilise 
dans le test enzymatigue est la L-glutamine; il donne par desamination 
I'acide L-glutamigue . X correspond aux ligands axiaux du cobalt gui 
peuvent etre differents I'un de 1' autre. 

Figure 18: Reaction catalysee par la*; SP2MT. La SP2MT catalyse le 

10 transfert d'un methyle du SAM au dihydrosirohydrochlorine ou 
precorrine-2 pour donner le precorrine-3. Le groupement methyle est 
transfers a la position C20 du noyau porphyrine. 

Figure 19: Structure de I'acide hydrogenobyrinigue et de I'acide 

hydrogenobyrinigue a,c-diamide, 

15 Figure 20: 

Affinites des proteines COBA et COBF pour le SAM. Les courbes donnent 
en unites arbitraires la radipactivite a la sortie de la colonne de 
TSK-125 pour chague proteins appliguee sur cette colonne. Les temps de 
retention sont indigues en minutes et le pic de radioactivite 
20 corrrespondant au SAM libre est pbserve au temps de 10 min 30 sec. 
Figure 21 : 

Comparaison des seguences de. COBA et de. GOBI . Seules les regions 1 , 2 
et 3, de forte homolpgie, sont presentees.^ Les signes = sont plages 
entre les residus identigues et - entre les residus homologues (H K R, 
25 L I V M, A G S T, y F W, D E Q N B 2 , P, C) . 

Figure 22: 

Comparaison des seguences primaires des proteines COBA de Pseudomonas 
denitrificans et CVSG de E. coli. L'alignement a ete fait suivant le 
programme de Kanehisa, 1984^ Les signes = sont places entre les 
30 residus identigues et - entre les residus homologues (H K R, L I V M, 
A G S T, y F W, D E Q N B 2, P, C). Les regions 1, 2, 3 correspondent 
aux zones de forte homologi&:entre les proteines. 

Figure 23: 

Comparaison des seguences de CYSG de E. coli avec des proteines COB de 
35 Pseudomonas denitrificans (COBA, COBF, COBI, COBJ, COBL et COBM). Les 
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comparaisons portent sur les regions 1, 2 et 3/ de fortes homologies, 
gui existent entre CYSG, COBA et GOBI* Les positions sur les sequences 
proteiques des regions presentant des homologies sont presentees sur 
la figure. Nous avons considere les groupes de residus homologues 
5 suivants: H K R, L I V M, A G S T, Y P W, D E Q N B Z, P, C. Si, a une 
meme position, il se trouve au moins 3 residus homologues, nous avons 
encadre ces acides amines. 

Figure 24: . 

Construction des plasmides pXL1148 et pXLl149. Le pXL1148 est 
10 construit comme suit: le fragment BamHI-BamHl-Sstl-Sstl de 1.9 kb du 
fragment de 8,7 kb contenant les genes cobH et cobl est purifie, et 
des "linkers" Xbal et EcoRI sont plages respectivement aux extremites 
BamHI et Sstl. Ce fragment est ensuite insere entre les sites Xbal et 
EcoRI du plasmide a large spectre d'hote pXL59 (Cameron et al., 1989) 
15 pour donner le plasmide pXL1148. Le pXLl149 est construit comme le 
pXL1148 si ce n'est que le fragment initialement purifie est le 
fragment BamHI-BamHI-SstI de 1.5 kb au lieu du fragment contenant en 
plus le petit fragment Sstl de 400 pb utilise poiir le pXL1146. Le 
fragment subit ensuite les memes traitements enzymatiques et le meme 
20 clonage dans le pXL59. 1, fragment Pstl-SstI de RSF1010 (De Graff et 
al., 1978); 2, fragment Pstl-BamHI de pACYC177 (Bagdasarian et al., 
1981); 3, fragment BamHI-SstI contenant I'operon lactose de E..coli 
sans promoteur, operateur, site d' initiation de la traduction et les 8 
premiers codons non essentiels de lacZ (Casadaban et al.,1983); 4, 
23 fragment Sau3AI de Pseudomonas putida KT2440 (Bagdasarian et al., 
1981);ori, origins de replication; nic, site de relaxation; Kmr gene 
de resistance a la kanamycine; mob , locus essentiel pour la 
mobilisation (Bagdasarian et al., 1981); B, BamHI; C, Clal; E, EcoRI; 
H, Hindlll; P, PstI; S, Sstl; Sa, Sail; X, Xhol; Xb, Xbal. 

30 Figure 25 : 

Proteines totales des souches SC510 Rifr, SC510 Rifr pKT230, SC510 
Rifr pXL1148, SC510 Rifr pXLl149 analysees en PAGE-SDS a 10% comme 
cela est decrit. Les bacteries ont ete cultivees pendant 4 jours en 
milieu PS4, puis des lysats des proteines totales ont ete effectues. 
Piste 1, SC510 Rifr; piste 2, SC510 Rifr pXL1149; piste 3, SC510 Rifr 
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pXL1146; piste 4, SC510 Rlfr pKT230. Les masses moleculaires des 

marqueurs de masse moleculaire sdnt indiquees. Les. positions ou les 
proteines GOBI et COBH migrant sont indiquees. 

» Figure 26: 

3 Construction des plasmides ^^ldl496 et pXLl546. Le plasmide pxi496 
« permet de surexp>rimer la prbteine COB^ ^ez E. coli et le plasmide 

PXL1546 permet de surexprimer COBF chez Pseudomonas deni trificans. Le 
fragment EcoRI-XhoI de 2.2 est excisi et purifie a partir du 
fragment de 8.7' kb. ll es£ clone au site EcoRI du phage M13mp19 pour 
10 donner le plasmide pXLi405. Ensuite m site Ndel est introduit par 
mutagenese dirigee, ' comme cela est diecrit precedemihent, a la position 
733 de ce fragment; de cette ^^a^iere une site Ndel se trbuve juste sur 
le codon d' initiation presume du gen^‘ Gobi*. Le nouveau plasmide ainsi 
obtenu est nomme pXL1406. ; Un fragment Ndel-Sphl-SphI de 1.5 kb, 

• ' ■ . S’ 

contenant le gene cobF a partir de son codon d' initiation presume, est 

purifie apres digestion partielle par les enzyme appropriees et 

• •• ■ 

ligature avec les fragWfents 'approprie^ du plasmide pXL694 (fragment 
EcoRI -Ndel de 120 pb contenant des^ sigiiaux d' expression de E. coli 
-voir texte- et fragment ;EcoRI-SphI de 3.1 kb contenant le g^e de 
20 resistance a I'ampicilline, l/es fonctions de replication du plasmide 
ainsi que les terminateurs de I'operon rrriB de E. coli comme cela est 
decrit dans le texte). Le plasmide ainsi construit est nomme pXL1496. 

' .. 'f *-• ■ . ' ' *•- ' 

Le pXL1546 est construiV con^e suit: le fragment EcoRI-BamHI-BamHI de 
2 kb du pXLl496 est purifie par diges^!6n partielle avec les enzymes 
25 appropriees; ce fragment contiient les s^lgnaux d' expression de E. coli, 
suivis du gene cobF , puis la^partie 5' "du gene cobG, elle-meme suivie 
des terminateurs de I'oplirpn trnB de E. coli cbmme cela est decrit 

» j. re- 

dans le texte; ce fragment >st 'clone dans le plasmide multihote pKT230 

. (Bagdasarian et al., 198-1) decrit sur la figure 30. B, BamHI; C, 

30 Clal; E, EcoRI; H, Hindlll; P, Pstl; S/ SstI; Sa, Sail; x, Xhol; Xb, 

^ Xbal; Kmr, gene de resistaiijc& a la kanamycine; Amp, gene de resistance 

a I'ampicilline. 

Figure 27 : 

Proteines totales des souclies SC510 Rifr, SC510 Rifr pKT230, SC510 
33 Rifr pXL1546 analysees en ^pE-SDS a 10% comme cela est decrit. Les 
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bacteries ont htk cultivees pendant 4 jo\irs en milieu PS4, puis des 
lysats des proteines totales ont ete effectues. Piste 1, SC510 Rifr; 
piste 2, SC510 Rifr pKT230; piste 3, SC510 Rifr pXLl546. Les masses 

moleculaires des margueurs de masse moleculaire sont indiguees. La 
3 position od la prot4ine COBF migre est indigu4e. 

Figure 28: 

Prot4ines totales des souches E. coli B et E. coli B pXLl496 analysees 
en PAGE-SDS a 10 % comme cela est d4crit. Piste 1, E. coli pXLl496 
cultiv4e en absence de tryptophane; piste 2, E. coli pXL1496 cultiv4e 
10 dans les memes conditions en pr4sence de tryptophane; piste 3, E. coli 
cultiv4e en absence de tryptophane; piste 4, E. coli cultiv4e dans les 
memes conditions en pr4sence de tryptophane. Les masses moleculaires 
des margueurs sont indigu4es. La position de migration de la prot4ine 
COBF est indigu4e. 

15 Figure 29 : 

Construction des plasmides pXL525 etpXL368. Le pXL368 est construit 
comme suit: le fragment EcoRV-Clal de 2.4 kb (nontenant les genes cobA 
et cobE) est purifi4 a partir du plasmide pXL556 (B. Cameron et al., 
1989) ce gui permet d'obtenir ce fragment avec un site BamHI et un 
20 site Xbal aux extr4mit4s; ce fragment est clon4 dans le pXL203 aux 
sites BamHI et Xbal. Pour la construction du pXL525 un "linker" Xbal 
est ajout4 au site EcoRI situ4 a I'extr4mit4 droite du fragment EcoRI 
de 8.7 kb; ce fragment EcoRl-Xbal de 8.7 kb est ensuite coclone avec 
le fragment EcoRI -Xbal de 2.4 kb provenant du pXL556 et nontenant cobA 
25 et cobE. Les sites de restrictions gui sont figur4s entre parenthese 
correspondent a des sites gui ont disparu apres traitement avec le 
large fragment de I'ADN polym4rase I de E. coli. 1 , fragment 

Pstl-SstI de RSF1010 (De Graff et al., 1978); 2, fragment PstI -BamHI 
de PACYC177 (Bagdasarian et al., 1981); ori, origine de r4plication; 
30 nic, site de relaxation; mob , locus essentiel pour la mobilisation; 
Kmr, gene de r4sistance 4 la kanamycine (Bagdasarian et al., 1981); 
B, BamHI; C, Clal; E, EcoRI; H, Hindlll; P, Psti; S, SstI; Sa, Sail; 
X, Xhol; xb, Xbal; tet, gene de r4sistance a. la t4tracycline; Ampr et 
Amp, gene de r4sistance 4 I'ampicilline. 

Figure 30: 
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Plasmides, du groupe d' incompatibilite Q, a large spectre d'hote chez 
les bacteries gram-negatives- Ces plasmides sont decrits dans une 
precedents publication (Cameron et al., 1989) et sont utilises dans la 
presente invention. 1, fragm^ent PstI-;SstI de RSF1010 (De Graff et 
5 al., 1978); 2, fragment Pstl-BamHI de pACYC177 (Bagdasarian et al., 
1981); 3, fragment BamHI-Sstl contenant I'operon lactose de E. coli 
sans promoteur, operateur, site ;d' initiation de la traduction et les 8 
premiers codons non essentiels de iacZ (Casadaban et al.,1983); 4, 
fragment Sau3AI de Pseudomonas puti^a KT2440 (Bagdasarian et al., 
10 1981);ori, origins de replication; nic, site de relaxation; Kmr gene 

de resistance a la kanamycine; Smr, ;,^ene de resistance a la 
streptomycins ; mob , locus essentiel pour la mobilisation 
(Bagdasarian et al., 1981); B, BamHl;.C, Clal; E, EcoRl; H, Hindlii; 
P, PstI; S, SstI; Sa, Sail; X, Xhol; Xbal. 

15 Figure 31 : 

Temps de retention de differents etalons corrinoides (1 mg/etalon) sur 
le systems de separation de decrit a 1' example 9. La colonne utilisee 
est une colonne de Nucleosil C-18 (Macherey-Nagel) Au niveau de 
chague pic d' absorbance un numiro est represents correspondant au 
20 corrinoide decrit ci-dessouS. Le temps de retention est porte en 
abscisse et 1' absorbance a 371 nm se trouve en ordonnee. 1, acide 
cobyrinique; 2, acide cobyrinique aramide; 3, acide cobyrinique 

. g-amide; 4, acide cpbyrinigue -a,g-diamide; 5, acide cobyrinique 

c-amide; 6, acide cobyrinique c,g-diamide; 7, acide cobyrinique 

23 a,c-diamide; 8, acide cobyrinique triamide; 9, acide cobyrinique 

tetraamide; 10, acide cobyrinique pentaamide; 11, acide cobyrique; 12, 
GDP-cobinamide; 13, cobinapide phosphate; 14, cobinamide; 15, 
cyanocobalamine 5 ' -phosphate ; 1 6 , cyanocobalamine . 

Figure 32: 

30 Sequence nucleotidique des deux brins du fragment Sal l- 
Sal l- Sal l- Sal l- Sal l- Bol l de 4748 pb de Pseudomonas denitrificans. Le 
brin situe en haut est a lire de 5' vers 3' dans le sens gauche droite 
qui correspond a 1' orientation gau^e droite du fragment de la carte 
de restriction presentee sur la figure 6. 

33 Figure 33: Sequence nucleotidique des deux, brins du fragment SstI- 




wo 91/11518 



PCT/FR91/00054 



28 

Sstl-BamHI de 3855 pb de Pseudomonas denitrificans. Le brin situe en 
haut est a lire de 5' vers 3' dans le sens gauche droite qui 

correspond a 1' orientation gauche droite du fragment de la carte de 
restriction presentee sur la figure 6. 

5 Figxire 34: 

Analyse des probabilites des phases codantes d'apres 1' usage des 

codons en utilisant le programme de Staden et HacLachlan (1982) sur 
les six phases de lecture du fragment Sall-Sall-Sall-Sall-Sall-Bgll de 
4748 pb. Pour les phases qui appartiennent au mime brin codant, la 
10 phase la plus probable correspond a celle ou une ligne pointillee, non 
interrompue par des codons stop, est placee sous la ligne de 
probabilite de cette phase. 4a. Analyse de la sequence correspondant 
aux nucleotides 200 a 800. Cette analyse permet d' identifier la phase 
ouverte 14. Elle commence a I'ATG en position 660 et se termine au 
15 TGA en position 379. 4b. Analyse de la sequence correspondant aux 
nucleotides 800 a 1500. Cette analyse permet d' identifier la phase 
ouverte 15. Elle commence au GTG en position 925 et se termine au TAA 
en position 1440. 4c. Analyse de la sequence correspondant aux 

nucleotides 1450 a 2600. Cette analyse permet d' identifier la phase 
20 ouverte 16. Elle commence i I'ATG en position 1512 et se termine au 
TGA en position 2510. 4d. Analyse de la sequence correspondant aux 
nucleotides 2500 ai 4650. Cette analyse permet d' identifier la phase 
ouverte 17. Elle commence au GTG en position 2616 et se termine au TGA 
en position 4511. 

25 Figure 35 : 

Analyse des probabilites des phases codantes d'apres 1' usage des 

codons en utilisant le programme de Staden et MacLachlan (1982) sur 
les six phases de lecture du fragment Sstl-Sstl-BamHI de 3855 pb. 
Pour les phases qui appartiennent au meme brin codant, la phase la 
30 plus probable correspond a celle ou une ligne pointillee, non 
interrompue par des codons stop, est placee sous la ligne de 
probabilite de cette phase. 5a. Analyse de la sequence correspondant 
aux nucleotides 1 a 905. Cette analyse permet d' identifier la phase 
ouverte 18. Elle commence a I'ATG en position 809 et se termine au TGA 
35 en position 108. 5b. Analyse de la sequence correspondant aux 
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nucleotides 955 d 2105. Ce^^e analyse ,permet d' identifier la phase 
ouverte 19. Elle commence i I'ATG en ^sition 1971 et se termine au 
TGA en position 1063. 5c. Analyse de la sequence correspondant aux 
nucl4otides 2000 a 3300. Cette analyse permet d' identifier la phase 
5 ouverte 20. Elle commence a I'ATG en position 2099 et se termine au 
TAG en position 3115. 5d. Analyse de la sequence correspondant aux 
nucleotides 3250 a 3855. CeMe analyse permet d' identifier la phase 
ouverte 21. Elle commence a i'ATG en position 3344 et se termine au 
TGA en position 3757. 

10 Figure 36: 4 

Construction des plasmides pXL233, pXL843 et pXL1558 a partir du 
PXL154. Les plasmides soat construits de la maniere suivante. Le 
fragment EcoRI de 3/5 kb, bon tenant le g4ne cobS tronque et la 

. sequence en amont, est excise du pXLI 54, puis purifie et clone dans 

15 le site EcoRI du pKT230.' Le plasmide ainsi construit est nomme pXL233. 
Le fragment EcoRI -Xhol-Xhol de 3,5 kb, nontenant le gene cobT et la 
sequence en aval, est excise et purifie a partir du pXL154 par 
digestions partielles. Le fragment EcoRI-EcoRI-EcoRI de 4,3 kb 
nontenant le gene cobS et la sequence en amont est excise et purifie 
20 a partir du pXL154, puis ligature au fragment de 3,5 kb precedent. Le 
fragment EcoRI -Xhol de 8 kb environ ainsi obtenu est clone dans les 
sites EcoRI et Sail du pXL59 pour generer le plasmide pXL843. Le 
plasmide pXL1558 est construit de la fagon suivante: le fragment 
Hindlll-Hindlll de 12 kb est excise du pXL154 et purifie puis les 
25 extremites sont remplies p4t le grand fragment de I'ADN polymerase I 
de E. coli. Cet insert est clone dans le pRK290 (Ditta et al. 1981) 
digere par EcoRI puis traite avec le' large fragment de I'ADN 
polymerase I de E. coli pour rendfe les extremites tranches. Les 
sites de restriction qui sont figures entre parenthese correspondent a 
30 des sites qui ont 'disparus au cours du clonage. 1, fragment Pstl-SstI 
de RSF1010 (Degfaff et al., t978); 2, fragment PstZ-BamHI de pACYC177 
(Bagdasarian et al., 1981),v.B> BamHi; c, Clal; E, EcoRI; H, Hindlll; 
P, Pstl; S, Ssti; Sa, Sall;\^,^ Xhol; Xb, Xbal; Tet gene de resistance 
a la tetracycline; Kmr gene de resistance 4 la kanamycine; Smr, gene 
de resistance a la streptomycine. 
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Figure 37; 

Etude des insertions du transposon TnSSp sur 1' insert Hindlll-Hindlll 
de 12 kb du pXL154. Les insertions du transposon sont cartographiees 
sur 1' insert Hindlll-Hindlll de 12 kb, clone sur le pXL1558. Les 
5 insertions chromosomiques dans la souche SC510 Rifr sont encadrees, 
celle qui ne I'est pas, est introduite dans la souche SBL27 Rifr. Un 
signe plus ou moins est represente sous cheque insertion pour indiquer 
le phenotype Cob de la souche ayant cette insertion. L' absence de 
complementation (ou la complementation) de la souche G2035 par des 
10 plasmides pXLI 558 :: TnSSp est indiquee par des signes moins (ou plus) 
au dessous de chaque insertion. Les inserts des plasmides, decrits 
dans la figure 36, sont representes. Les signes plus (ou moins) , sur 
ces plasmides et alignes avec les insertions au transposon, 
schematisent la complementation (ou (1' absence) de la souche mutee au 
15 transposon par le plasmide. Les phases ouvertes deduites de la 
sequence sont aussi portees sur cette figure (ORF14 a 17 ainsi que les 
g^nes cob correspondents (cobs et cobT). B : EcoRl; H. : Hindlll; x : 
Xhol. 

Figure 38 : 

20 Construction des plasmides pXL1286, pXL1303, pXL1324, pXL1490B et 

pXLI 557 a partir du pXL519. La position du fragment sequence est 

presentee dans la partie superieure de la figure au dessus de la carte 
de restiction du cluster; il s'agit d'un Sstl-Sstl-BamHI de 3.9 Itb. 
Les plasmides sont construits de la maniere suiante. Le fragment 
® 9 lH~EcoRI de 2 kb, nontenant le gene cobU et la la sequence en aval, 
est excise du pXL519 puis purifie et clone aux sites BamHI et EcoRI 
du PKT230 pour generer le plasmide pXLI 286. Le fragment Sstl-EcoRI de 
2,7 kb, nontenant le grae cobV tronque, le gene cobU et la sequence en 
3val, est excise du pXL519 puis purifie et clone aux sites SstX et 
30 EcoRI du PKT230 pour generer le plasmide pXLI 324. Le fragment 

Sstl“SstI de 1,6 kb, nontenant le gene cobV tronque et la sequence en 
amont, est excise du pXL519 puis purifie et clone au site SstI du 
PKT230 pour generer le plasmide pXLI 303. Le fragment Sstl-Sstl-BamHI 
de 3.85 kb est purifie apres digestion total© du pXL519 par BamHI et 
digestion partielle par SstI . Ce fragment est ensuite clone aux sites 
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BamHI et SstI du pKT230 pour, generer le pXLl490B. Le plasmide pXL1557 
est construit de la fagon suivMte: le fragment Hindlll-BamHI de 9 kb 
est excise du pXL519 et purifi4 puis les extremites sent remplies par 
le grand fragment de I'ADN polymerase I de E. coli. Cet insert est 
5 cion* dons 1, (Bltu ot al. 1981) dig*r* par EcoRI puia trait* 

avec le large fragment de l'«DN polyo4rase 1 de E. coli pour rendre 
les extremitds f ranches. Lei sites de restriction qui sont figures 
entre parenthese correspondeht 4 des sites qui ont disparus au cours 
du clonage. 1, fragment Pst^Sstl de RSF1010 (Degraff et al., 1978); 
10 2, fragment Pstl -BamHI de pRGX)C177 (Bagdasarian ef al., 1981); b , 
BamHI;Bg, Bglll; c, Clal; E, EcdRl; H, Hindlll; P, PstI; S, Sstl; Sa, 

Sail; X, Xhol; Xb, Xbal; Tetr gene de resistance 4 la tetracycline ;Kmr 

gene de resistance a la kartamycine; Smr, gene de resistance a la 
streptomycine . 

15 Figure 39: Etude des insertions du transposon TnSSp sur 1' insert 

Hindlll-BamHI de 9 kb du pja|19. Les insertions du transposon sont 
cartographiees sur 1 ' insert^ Hindill-BainHI de 9 kb, clone sur le 
PXL1557. Les insertions chroi^dmiques dans la souche SC510 Rifr sont 
encadrees, celles qui ne le sont pas, sont introduites dans la souche 
20 SBL27 Rifr. Un si^e plus v ou moins est represente sous chague 

insertion pour indiquer le ^i^type Cob de la souche ayant cette 
insertion. L'absence de comp^^ljation (ou la complementation) de la 
souche G2040 par des plasmides pXL155"7::Tn5Sp est indiquee par des 
signes moins (ou plus) au dessbus de chaque insertion. Les inserts des 

25 plasmides, ddcrits dans la fi'^e 6, sont repfdsdntes. Les signes plus 

(ou moins), sur ces .plasmidfes et 4lign4b avec les insertions au 
transposon, schdmatiseiit Jta 'compldmeiitation (ou 1' absence) de la 
souche mutee au transposon i ^ar le phases ouvertes 

ddduites de la sequence sorit aussi portees sur cette figure (0RF18 a 
30 21) ainsi que les genes cob corrdspondant (cobu et cobV) . 

Figure 40: ;,‘- 

Sequences codantes de chacutf des genes du fragment de 4,8 kb, 
respectivement cobX, cobs et cobT, soirt indiqu^s. La sequence del 
proteines COBX, COBS et COB^ ci^ees par ceS sequences figure sous les 
sequences codantes re^ctives cobX, cobS et cobT. La legende est 
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identigue a celle de la figiire 15. 

Figure 41: 

Sequences codantes de chacun des g^es du fragment de 3,9 kb, 
respectivement cobU et cobV, sent indiquees. La sequence des 
5 proteines COBU et COBV codees par ces sequences figure sous les 
sequences codantes respectives cobU et cobV. La legende est identique 
a celle de la figure 15. 

Figure 42: 

A. Proteines totales des souches E. coli BL21 pLysS pET3b, E. coli BL21 
10 pLysS pXLl937 analysees sur PAGE-SDS 10%. Piste 1, BL21 pLyspET3b; 

piste 2, E. coli BL21 pLysS pXL1937. 

B. Proteines totales des souches : E.coli BL21, E.coli BL21 pXL1874 et 
E.coli BL21 PXL1875 analysees sur PAGE-SDS 10%. Piste 1, E.coli BL21 ; 
piste 2, E.coli BL21 pXL1874; piste E.coli BL21 pXL1875. 

15 Les masses moleculaires des marqueurs sont indiquees. La bande 
correspondant a la proteine surexprimee est indiquee par une fleche. 

Figure 43: Sequence nucleotidique des deux brins du fragment 

Sstl— Sst l— Sst l— Sst l— Bql ll— Bel li de 13144 pb de Pseudomonas 
denitrificans . Le brin situe en haut est a lire de 5' vers 3' dans le 
20 sens gauche droite qui correspond a 1' orientation gauche droite du 
fragment de la carte de restriction presentee sur la figure 46. 

Figure 44: Carte de restriction du fragment 

SstI-SstI-SstI-S_s_tI-BqlII-SstI-BqlII de 13144 pb de Pseudomonas 
denitrificans . La ou les positions de sites de restriction courant sont 
25 indiquees par ordre croissant du nombre de coupure sur le fragment 
sequence; les positions correspondent a la sequence presentee sur la 
figure 43. 

Figure 45: Analyse des probabilites des phases codantes d'apres I'usage 
des codons en utilisant le programme de Staden et MacLachlan (1982) sur 
30 les six phases de lecture du fragment 

^^fcl~Sstl-SstI-SstI- Bql Il- Sst l- Bql II de 13144 pb de Pseudomonas 
denitrificans . Pour les phases qui appartiennent au meme brin codant, 
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la phase la plus probable corre^ond a celle ou une ligne pointillee, 
non interrompue par des codons stop, est placee sous la ligne de 

probabilite de cette phase. 

1. Sequence correspondent aux nucleotides 1 a 2266. Cette 

5 analyse permet d' identifier 'la phase - ouverte 22. Elle 

commence a I'ATG en position 429 et se termine au TAG en 

position 1884. • . 

2. Sequence correspondent aux nucleotides 2266 a 4000. Cette 

analyse permet d' identifier la phase oucr^te 23. Elle 

10 commence a I'ATG en position 3364 et, se termine au TGA en position 
3886. 

3. Sequence correspondant aux nucleotides 3800 a 5000. Cette 

analyse permet d' identifier la phaseiouyerte 24, Elle commence a I'ATG 
en position 3892 et se termine au TAG en position 4954 . 

Sequence correspondatit aux nucleotides 5000 a 9000. Cette 
analyse permet d' identifier la phase ouverte 25. Elle commence a I'ATG 
en position 5060 et se teirmine au TAG en position 8885. 

5. Sequence correspondent aux nucleotides 9000 a 9700. Cette 
analyse permet d'identifier la phase ouverte 26. Elle commence a I'ATG 
20 en position 9034 et se termine au TGA en position 9676. 

Sequence correspondant aux nucleotides 9600 a 13144. Cette 
analyse permet d'identifier les phase ouvertes 27, 28, 29 et 30. Elies 

commencent respectivement aux ATG en- position 9678, 10895, 11656 et 

13059 et se terminent aux codons stop en position 10101, 10304, 12181 
25 et 12366. Les phases ouvertes 28 et 30 se trouvent sur le brin 

complementaire de celui codant correspondant a toutes les autres phases 
ouvertes . 

Figure 46: Fragment EcoRl-Bglii-EcoRl-Balll de 13.4 kb, positions des 
insertions des transposons TnSSp sur le fragment EcoR i de 9,1 kb, 
30 positions des insertions des transposons Tn5 sur 1' insert du plasmide 
PXL189 ainsi que les inserts des divers plasmides utilises lors des 
experiences de complementation des soijches SC510 Rif^ ::Tn5Sp. Les 
complementations des mutants sd510 Rif? ::Tn5Sp par les plasmides sont 
indiquees (+)-entre 5 % et 100 % du niveau de la souche parentale, SC510 
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Rif^-, (j.) -complementation partielle, entre 0.5 a 5 % du niveau de 
SC510 Rif^-, ou (-)-absence de complementation, c'est a dire, moins de 
mille fois moins que SC510 Rif^- positionnes juste au dessus des traits 
schematisant 1' insert des plasmides et alignes avec les sites 
^ d' insertion des mutant correspondants . Au desspus de la cartographie 
des insertions des transposons Tn5 sur 1' insert du plasmide pXL189 est 
representee la complementation (♦), ou 1' absence de complementation (-) 
de ces plasmides mutants pour les mutants d • Aorobacter ium tumefaciens 
G632 et G633. Sur la partie droite de la figure se trouve un tableau 
repr4sentant la complementation des mutants G622, G623 et G630 (Cameron 
et al., 1989) par differents plasmides; (+) -complementation totale, 100 
% du niveau de la souche parentale, C58C9 Rif^-, (^) -complementation 
partielle, entre 10 et 50 % du niveau de C58C9 Rif^-, ou (-)-absence de 
complementation- . 

Les differents plasmides dont 1' insert est represente sont construits 
comme suit (les fragments sont excises soit du pXL156 soit du pXL157): 
pXL616 correspond au fragment EcoR I- Bam HI de 2.5 kb clone aux memes 
sites de pKT230 (Bagdasarian et al., 1981); 

PXL593 correspond au fragment Bam HI de 3.1 kb clone au site BgmHI de 
20 pKT230 (Bagdasarian et al., 1981); 

pXL623 correspond au fragment BamH I- Xho I de 1.9 kb clone aux sites 
BamHI-Sall de pXL59 (Cameron et al., 1989); 

PXL1909 correspond au fragment BamH I - BamH I- BamH I de 8.4 kb clone au 
site BamH I de pKT230 (Bagdasarian et al., 1981); 

25 le pXL221 correspond au fragment EcoR I- Cla l de 1.6 kb clone aux memes 
site de pXL59 (le site Cla l dans leguel est clon§ ce fragment est le 
site Cla l du multisite de pXL59 (Cameron et al., 1989); 

•les pXL1908 et 1938 correspondent au meme insert, fragment 
Xho l - BamH I - Bam HI de 6.5 kb, auguel des linkers Xba l ont ete ajoutes; 
30 cet insert est clone dans les deux orientations au site Xba l de pXL435 
(Cameron et al., 1989); une fleche positionnee sur la figure indigue la 
position du gene de resistance a la kanamycine vis a vis des extremites 
de 1' insert des deux plasmides; 

pXL206 correspond au fragment Bam HI de 5.2 kb clone au site BamHI de 
35 pKT230 (Bagdasarian et al., 1981); 
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PXL297 correspond au fragment EcoRl de 9.1 kb clone au site EcoRl de 
PKT230 (Bagdasarian et al., 1981). 

Les phases ouvertes (PO) definies par le sequengage du fragment (PO 22 
a 30) sont representees ainsi que les g&aes £ob correspondants ; une 
fleche indique la polarite de la transcription. 

5 E, ScoRI; B, BamHI; Bg, Bgill; Cl, £lal; sau, gau3AI; X, Xhol; 

Figure 47 : Sequences codantes de ^acun des genes du fragment de 13.4 
kb, respectivement cq^, cote et c^, cote et cobO sont indiquees. La 
sequence des proteines COBQ, cOBP, COBW, COBN et COBO codees par ces 
sequences figurent sous leur sequence codante respective cobO . 
10 cqte, cote, sate et cobO. La legende est identique a celle de la figure 
15- 

figure 48 : A-Sequence NH2-terminale de la SUMT de m! ivanovii et 
sequence des oligonucleotides 923 946, 947; -, signifie qu'a cette 

position, le residu n'a pas pu etre determine; pour 1' oligonucleotide 
15 antisens les acides amines indiques au-dessus de la sequence 
correspondent aux anticodons presentes. B-presentation de 
1' amplification enzymatique d'un fragment interne au gene de structure 
de la SUMT de M. ivanovii avec les oligonuleotides 946 et 947. 

Figure 49 : Constrution de la forme replicative recombinante pGIO. Le 
20 fragment de 615 pb obtenu parAmplif ication est digere par Hindi II et 
EcoRl puis purifie comma cela est decrit. Ce fragment est ensuite mis a 
ligaturer avec la forme replicatiW du phage M13mp19 digeree par les 
memes enzymes • Le clone recombinant est trouve comme cela est decrit 
dans le texte. 

25 Figure 50 : Autoradiographie d'un. blot d'AdN genomique de M. ivanovii 
digere par diverses enzyihes, sfpare par dlectrophorese en gel d' agarose 
puis transfers sur membrane de "Nylon comme cela est decrit precedemment . 
La membrane est hybridee avecVla sonde pGIO comme cela est decrit 
precedemment. 1, Hindlll-Bglllf 2, Kpnl-Bglll; 3, EcoRI-Bglll; 4, 
Bglll-Pstl. Les tallies des diflerents fragments qui hybrident avec la 
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sonde sont representes en kb. 

Figure 51 : Sequence nucleotidique des deux brins du fragment de 955 pb . 
de M. ivanovii. Le brin situe en haut est a lire de 5' vers 3^ dans le 
sens gauche droite. 

5 Figure 52: Sequence codante du gene corA de M. ivanovii obtenue a partir 
de la sequence de 955 pb. La sequence primaire de la proteine CORA est 
aussi representee. Les acides amines sont representes au-dessus de leur 
codon et le codon stop est figure par une etoile, Les principales 
proprietes physiques de la proteine CORA de M. ivanovii, a savoir, la 
10 composition en acides amines, en nombre et en pourcentage, le poids 
raoleculaire, 1' index de polarite, le point isoelectrique, la densite 
optique a 280 nm d'une solution a 1 mg/1 de proteine purifiee. Le profil 
d'hydrophobicite de la proteine CORA de M. ivanovii; ce profil a ete 
realise d'apres le programme de Hopp et Woods (1981). Les valeurs 
15 positives correspondent a des regions de la proteine qui sont 
hydrophiles. Sont indiquees, la position des acides amines en abscisse, 
et en ordonnee la valeur de 1' index d'hydrophilicite; si cette valeur 
est positive, cela indique que dans cette region la proteine est 
hydrophile. 

20 Figure 53 : Comparaison des sequences primaires des proteines COBA de P. 
denitrificans et CORA de M. ivauiovii. Les proteines ont ete alignees 
grace au progamme de Kanehisa (1984). =, acides amines identiques; -, 
acides amines homologues d^apres les criteres definis precedemment (voir 
figure 22 et 23). 

25 Figxire 54 : Construction des plasmides pXL1832 et pXL1841. 

Les legendes decrites plagees sur la figure permettent de suivre les les 
constructions . 

Techniques generales de clonage, de biologie moleculaire et de 
biochimie. 
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Les methodes classiques de biologic moleculaiye telles que la 
cantrifugabion d''AON: plasniiddj:|u6 an gradiant da chlorura da 
cesium-bromure d'ethidivun, les digestions par des enzymes de 
restriction, 1 ' e^ctrophorese sui? gel, 1' electroelution des fragments 
5 d'ADN a partir de gels d' agarose, la transformation dans E. coli, etc, 
sont decrites dans la litterature (Maniatis et al., 1982, Ausubel et 
al., 1987). . ... 

Les en?ymes de restriction pnt ete foumies par New-England Biolabs 
(Biolabs), Bethesda Reseacii' Laboratories (BRL) ou Amersham Ltd 
10 (Amersham) . Les oligonucleotides "linkers** ont ete foumis par 

Biolabs. Pour les ligatures,>^lfjB‘s fraginents d'ADN sont separes selon 
leur taille sur des gels d' agarose O.X % ou acrylamide 8 %, purifies 
par electroelution, extraits '.au phenol, precipites a 1' ethanol puis 
incubes dans un tampon Tris-*H01 pH 7.4 50 mM, MgCl2 10 mM, DTT 10 mM, 
15 ATP 2 mM, en presence d'ADN ligase du phage T4 (Biolabs). Si 

necessaire, les fragments d'ADN ayant des. extremites 5' proeminentes 
sont dephosphoryles par un traitement 1 la phosphatase alcaline 
d'intestin de veau (CIP, Pharmacia) a 37'C pendant 30 mn dans le 
tampon suivant: glycine 100 mM, MgC12 1 mM, ZnC12 1 mM, pH 10.5. La 
20 meme technique est utilisee ^ur la dephosphorylation des extremites 
3' proeminentes ou tranches, ,ma±s le traitement est de 15 mn a 37 *C 
puis de 15 mn a 56 *C. L' enzyme est inactivee par chauffage du melange 
reactionnel a 68 *C pendant 1 5 - mn -en- presence de SDS 1% et de NaCl 100 
mM suivi d'une extraction aur ph&igl-chlorbforme. et d'une precipitation 
25 a 1' ethanol. Le rempliss^e des extrimites 5' proeminentes est 

effectue par le fragment de «lendw , ‘de I'ADN polymerase I d'E. coli 
(Biolabs). La reaction est effectuee li .temperature ambiante pendant 30 
mn dans un tampon Tris-HCl pH 7.2 50 mM, dNTPs 0.4 mM, MgS04 10 mM, 
DTT 0.1 mM, BSA 50 mg/ml. Le remplissage des extremites 3' 

30 proeminentes est effectue eft presence de I'ADN polymerase du phage T4 
(Biolabs) selon les, recommandations- do? fabriqviant. La digestion des 
extremites proeminentes 'esif effectuee par traitement limi-te a la 
^'iclease SI (BRL) selon li§s recommandations du fabriquant. Des 
oligonucleotides **linkers" sont ajputes sur des extremites de 
35 fragments d'ADN comme cela est deja decrit (Maniatis et al, 1982). La 
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mutagenese in vitro par oligodeoxynucleotides est effectuee selon la 
methode developpee par Taylor et al., 1985, en utilisant le kit 
distribue par Amersham. Les ADN ligatures sont utilises pour 
5 transformer la souche rendue competente: E. coli MCI 060 [ 

4(lacIOPZYA)X74, galU, galK, strAr, hsdR] pour les plasmides ou E. 
coli TG1[^{lac proA,B), supE, thi, hsdDS/ F' traD36, proA+, B+, laclq, 
lacZidMIS] pour les formes replicatives de phages derives du 
bacteriophage Ml 3. Les ADN plasmidigues sont purifies suivant la 
10 technique de Bimboim et Doly, 1979. Les minipreparations d'ADN 

plasmidique sont faites suivant le protocole de Klein et al., 1980. 
Les preparations d'ADN chromosomiques de bacteries gram-negatives sont 
realisees comrae cela a ete deja decrit (Cameron et al., 1989). Les 
sondes radioactives sont preparees par translation de coupure suivant 
15 la methode deja detaillee (Rigby et al., 1977). Les hybridations entre 
des sequences d'ADN ainsi que 1' immobilisation des acides nucleiques 
sur membranes de nitrocellulose sont effectuees comme cela a ete 
decrit (Cameron et al., 1989). Lors de clonages pour lesquels il y a 
une faible probabilite de trouver le clone recombinant recherche, 
20 ce\ax-ci sont trouve apres hybridation s\ir filtre comme cela est deja 
decrit (Maniatis et al., 1982). La sequence nucleotidique de fragments 
d'ADN est realises par la methode de terminaison de chaines (Sanger et 
al., 1977). Dans le melange reactionnel le dGTP est remplace par le 
7-deaza-dGTP, ceci afin d'eviter les compressions de bandes lors de 
25 1 ' electrophorese sur gel d' acrylamide, provoquees par le pourcentage 

en GC eleve de 1' ADN. Les milieux de culture utilises pour la partie 
bacteriologique ont deja ete presentes (Maniatis et al., 1982). Les 
cultures en milieu PS4 sont realisees comme cela est deja decrit 
(Cameron et al., 1989); les souches de Pseudomonas denitrificans SC510 
30 Rifr et G2 Rifr sont cultivees en milieu PS4 comme suit: des 
Erlenmeyers de 250 ml conteiiant 25 ml de milieu PS4, avec si besoin 
I'antibiotique selectif pour le plasmide porte par cheque souche, sont 
ensemences avec une dilution au 1/100 de preculture saturee en milieu 
L (Miller 1972), avec, si besoin est, I'antibiotique selectif pour le 
plasmide porte par chaque souche; ces cultures sont incubees 6 jours a 
30 *C, puis les mouts sont analyses pour leur titre en cobalamines ou 
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bien I'activite enzymati^e "^de certaines enzymes de la voie. Les 
souches d' Agrobacterium ttImefAciens, Pseudbmpnas putida et de 
Rhizobium meliloti sent cultivees a 30*Cr' sauf s^cifications, elles 
sont cultivees en milieu L. Les'" corijugaisons bacteriennes sont 
5 realisees comma cela ' est de^a dectit fCameron ^t al., 1989). Les 

extraits de proteihes totales/soht realises comme cela est deja decrit 
(Ausubel et al., 1987), Les electrophoreses (SD^-PAGE) d' analyse des 
proteines en gel d' acrylamide eh - conditions denaturantes sont 
effectuees comme cela 'est ''deja decrit (Ausubel et al., 1987). 
10 L'appareil PhastSystem (Pharmacia) utilisant le systems de tampons 

discontinus de Laemli (Laemli, 1 970 J ^ est aussl utilise; differents 
gels sont utilises en fonctiOn des poi^s mOl'eculaire'is des proteines a 
analyser ainsi que leur pufete: PhastGel gradient 8-25 PhastGel 

Homogeneous 12.5 La colotatiop, est effectuee soit au bleu de Coomassie 
15 a I'aide du PhastGel Blue R (Pharmacia) -soit au nitrate d' argent en 
'itilisant le PhastGel silver ’ Kit (Phaifmacia) en se conformant aux 
instructions du fabriquant. Les sequences 11H2-terminales des proteines 
sont determinees par la techhique de degradation d'Edman en utilisant 
un sequenceur automatise ()qjEd.ied Biqsystems modele 407A) couple a un 
20 appareil de CLtlP poifr 1' identification des derives 
phenylthiohydantoines . 

^EXEMPLB, 1 ~ Isblement de ffa^^ts d''AdN de P.denitrificans contenant 
des genes Cob " 

Cet exemple decrit 1 ' isofelnent de fragments d'ADN de Pseudomonas 
25 denitrificans portant des g^es Cob. Ce§ fragments ont ete mis en 
evidence par des experiences de Complementation de mutants Cob 
d' A.tumefaciens et P .nutida ’ (Cameron et al 1989) . 

Ces mutants COb ont ete obteinus par mutagenese avec la 
N-methyl-N'-nitro-N-nitrosoguahidine seloh la technique de Miller 
30 (Miller et , 1972), ou 'par insertions du transposon Tn5. De cette 
maniere, des souches inca:pabies de synthetiset les cobalamines ont ete 
mises en evidence, et en particulier,^ ie ttutant cob G572 de P.putida . 
et les mutants Cob G159, Gf61 , G164 , ‘ 6l§9, G171 , G258, G609, G610, 
G611, G612, G613, G614, (»15> G616, GS'^, G622, G623, G630, G632, 




wo 91/11518 



PCT/FR91/00054 



40 

6633, 6634, 6638, 6642, 6643, 62034, 62035, 62037, 62036, 62039, 

62040, 62041, 62042 et 62043 de A.tumefaeiens . 

Parallelement, une banque d'ADN genomique de 
P. deni trif leans est realises dans xin vecteur mobilisable a large 
5 spectre d'hote, pXL59, par digestion, en presence d'enzymes de 
restriction, de 5 pg d'ADN (Cameron et al., 1989), 

Par compl^entation, plusieurs plasmides ont pu etre 
isoles, permettant de complementer les mutants cob de P.outida et 
d' A.tumefacien . Parmi ceux-ci on notera plus particulierement les 
10 plasmides pXL151, pXLl54, pXL156, pXL157 et pXI,519 . 

Ces plasmides ont ete isoles et des fragments d'ADN ont pu 
etre excises, purifies et analyses par restriction. Ces fragments sont 
presentes sur les figures 6 et 44; Un fragment Cla l- Hind lll- Hind lll- 
-Hind lll de 5,4 kb, un fragment EcoR I- EcoR I de 8,7 kb, un fragment 
15 Sall-Sall-Sall-Sall-Sall-Bgll de 4,8 kb, un fragment Sstl-Sstl-BamHI 
de 3,9 kb et un fragment EcoRI-BglII>EcoRI-BglII de 13,4 kb. 

EXEHPLE 2 - Sequenqage des fragments d'ADN isoles 

Cet exemple illustre le sequenqage de fragments d'ADN 
portant des genes cob de Pseudomonas denitrif leans SC510. 

20 2.1. Sequenqage d'un fragment Cla l -Hind lll -HindT TT -Hi ndT TT 

de 5,4 kb 

Ce fragment est contenu dans le plasmide pXL157 decrit 
dansl ' exemple 1. Apres excision, des sous fragments du fragment de 5,4 
kb ont ete clones dans les phages M13mp18, ou M13mp19 (Norrander et 
25 1983), ou M13tg130, ou M13tg131 (Kieny et al., 1983) dans les 

deux orientations. Des deletions ont ete ensuite realisees vitro 

par la methode de Henikoff (1987). Ces deletions ont ensuite ete 
sequencees avec le "primer universel" comme amorce de synthese des 
reactions de terminaison de chaine. Le recouvrement entre ces 
differentes deletions a permis d'etablir la sequence totale, sur les 
deux brins, du fragment de 5,4 kb (figure 7).' Ce fragment comprend 

5378 pb. Sur la sequence decrite a la figure 7 figurent, avant le site 
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Clal, trois sites de restriction (Pstl. Sai l et Xbal) qui sent apparus 
lors du clonaqe du fragment en question eh vue du sequengage dans des 
multisites de clonage. Lorsqne par la suite nous nous refererons, dans 
la presente mventionr t a la sequence de ce fragment 
5 Cla l- Hind lll- Hind lll- Hind lll . ce sera a la sequence presentee a la 
figure 7 ou les 22 premieres bases ne correspondent pas a de I'ADN de 
Pseudomonas denitrificans (ainsi toutes les positions de site de 
restriction ou de debut de phase ouverte se referent a la sequence 
presentee a la figure 7). 

iO 2.2 Sequence nuqleotidique d'un fragment EcoR l -Eco RI de 

8,7 kb 

Ce fragment est porte par le pXL151 decrit dans 1' example 
1 . Le site EcoRl ainsi que les 70 pb adjacentes situees a la droite de 
ce fragment proviennent du pXL59 qui est le vecteur qui a servi a 
•15 construire 'le pXLISI par clonage d'un fragment Sau 3AI de Pseudomonas 
denitri f icans SC510. Apres excision, des sous fragments du fragment de 

8.7 kb ont ete clones dans les phages M13mp18, ou M13mp19 (Norrander 
si • , 1983), ou M13tg130, pu • M13tg131, dans les deux orientations 

(Kieny et al., 1983). Des delations ont §te ensuite realisees in vitro 
20 par la methode de Henikoff. (1987). Ces delations ont ensuite ete 
sequencees avec le "primer uniyersel" comme amorce de synthese des 
reactions de terminaispn.de chaine. Le recouvrement entre ces 
differentes deletions a permis d'etablir sequence totale, sur les 
deux brins, du fragment de 8,7 kb; (figure 8). Ce fragment comprend 
25 8753 pb. 

2.3. Sequengage d'un fragment 

Sall-Sall-Sall-Sall-SalZ-Bgll de 4,8 kb. 

Ce fragment est contenu dans le plasmide pXLl54 decrit 
dans 1' example 1. Le protoqple est identique a pelui utilise dan p 
30 1' example 2.2. La sequence totale sur les deux brins du fragment de 

4.8 kb est presentee sur la figure 32. Ce fragment contient 4749 pb. 
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2.4. S&iuence nucleotidigue d'un fragment 
Sstl-Sstl-BamHT de 3,9 kb. 

Ce fragment est Indus dans le plasmide pXL519 decrit dans 
example 1. Le protocole est identigue a celui utilise dans I'exemple 
5 2.2. La sequence totale sur les deux brins du fragment de 3,9 kb est 

presentee sur la figure 33. Ce fragment contient 3855 pb. 

2.5. Sequence nucleotidique d'm fragment 
EcqRI-Bglll-EcqRI'-Bctlll de 13.4 kb. 

Ce fragment est contenu dans les plasmides pXL156 et pXL157 
10 decrits dans I'exemple 1. Le protocols utilise est identigue a celui de 
1' example 2.2. La sequence sur les deux brins du fragment de 13.15 kb 

est presentee sur la figure 43. Elle correspond a la sequence totale du 

fragment de 13.4 kb mis a part 250 pb, correspondent a un fragment 
EcoRI-SstI, se trouvant a I'extremite gauche de celui-ci. 

13 A partir de ces sequences nucleotidiques, des cartes de 

restriction ont ete obtenues pour les enzymes qui coupent le mo ins 
frequemment (figures 6 et 44). Le pourcentage en bases GC de I'ADN de 

Pseudomonas denitrif icans SCI 50 est relativement eleve (65,5 %) et se 

traduit par des compressions sur les gels de sequence. Pour eviter ces 
2Q probl^es deux solutions sont apportees : 

i) 1 'utilisation du 7-deaza-dGTP au lieu du dGTP dans les 
reactions de sequence pour diminuer les structures secondaires gui se 
forment pendant 1 ' electrophorese dans le gel de sequence et 

ii) le sequengage des deux brins. 

23 EXEMPLE 3 - Analyse de ces sequences nucleotidiques : determination 
des phases ouvertes 

Les sequences nucleotidiques des fragments Cla l- Hind lll- 
Hindlll-Hindlll de 5,4 kb (figure 7), EcqRI-EcpRI de 8,7 kb (figure 
8), Sall-Sall-Sall-Sall-Sall-Bgll de 4,8 kb (figure 32), 

30 Sstl-Sstl-BamHI de 3,9 kb (figure 33) et EcoRI-Bglll-EcoRI-Bglll de 
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13,4 kb (figure 43) permettent de dSfinlr des phases ouvertes. Conune 
il s'agit d'ADN a haut pourcentage en GC, les phases ouvertes sent 
nombreuses vu la faible frequence de codons d' arret de traduction. Une 
etude de la probabilite des phases codantes d'apres usage des codons 
en utilisant la methode de Staden et MacLachlan (1982) est realisee. 

5 Elle caracterise les phases ouvertes qui ont la meilleure probabilite 
d'etre codantes par rapport =;aux auttes phases du meme brin d'ADN, 
cette probabilite est fonction de 1' usage des codons de g&ies deja 
sequences provenant des bacteries du genre Pseudomonas . De cette 
maniere : 

iO 3.1. Cinq phases ouvertes sont caracterisees pour le 

fragment Clal- Hind lll- Hind lll- Hind lll de 5,4 kb. Elies sont nommees 
phases 1 a 5 et leurs positions sur la sequence du fragment de 5,4 kb 
sont les suivantes (sur la sequence 5'-»3' du site Clal vers les sites 
Bind ing : 

15 Tableau : Phases ouvertes probables du fragment Clal- Hind lll- 

Hindlll- Hind lll de 5,4 kb. Les positions sur la sequence correspondent 
avix positions sur la sequence decrite a la figure 7 ; le brin codant 
est le brin 5 ' -*3 ' correspondent au brih superieur sur cette f igxire . 



20 



25 



N«an4ro de la 
phase 


Codon de 
d^marrage 
de la 

traduction 


Codon 

stop 


Poids moldculaire 
en kD 

de la protdine codee 


1 


549 


1011 ' 


15.5 


2 


1141 


1981 


29.2 


3 


1980 


3282 


45.7 


4 


3281 


4280 


35.0 


5 


4284 


5253 


34.1 



Les representations des probabilites que ces phases 
ouvertes soient des phases codantes, avec parallelement celles 
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observees sur les autres phases (5 au total) sont port^s sur la 
figure 9. Ces cinq phases sont codees par le meme brin. Quatre d'entre 
elles (phases ouvertes 1 a 4) presentent les caracteristiques de 
phases codantes en couplage traductionnel (Normak et al., 1983), a 
5 savoir que le codon d' initiation de traduction de la phase x+1 
chevauche le codon de tenninaison traduction de la phase x ou bien que 
ceux-ci sont tres proches. 

3.2. Huit phases sont caracterisees pour le fragment 
EcoRI- EcoRl de 8,7 kb. Elles sont nonunees phases 6 a 13 et leurs 
10 positions sur la sequence du fragment de 8,7 kb sont portees sur le 
tableau ci-desso\is. 

Tableau : Phases ouvertes probables du fragment EcoRl 8,7 kb. Les 
positions sur la sequence correspondent a\ix positions sur la sequence 
decrite sur la figure 8 ; sur cette figure, le brin codant est le brin 
15 superieur sauf pour la phase 1 1 . 



20 



25 



Num^ro de la 
phase 

de traduction 


■ 

Codon de 
d^marrage 


Codon 

stop 


Poids mol4culaire 
en kD 

de la proteine codee 


6 


736 


1519 


28.9 


7 


1620 


2997 


46.7 


8 


3002 


3632 


22.0 


9 


3631 


4366 


25.8 


10 


4365 


5127 


27.1 


11 


5893 


5110 


28.0 


12 


5862 


7101 


42.9 


13 


7172 


7931 


26.8 



Les representations des probabilites de ces phases 
ouvertes, avec parallelement celles observees sur les autres phases (6 
phases au total) sont portees sur la figiire 10. A 1' exception de la 
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phase 11, ces phases sent codees pa&^ le meme brln. Quatre d'entre 
elles (de 7 a 10) presenteni les cafacteristiques de phases codantes 
en couplage traductionnel (N^rmark et al . . 1983), a . savoir que le 

codon d' initiation de traduction de la phase x+1 cheyauche le codon de 
5 terminaison de traduction de la phase x ou bien que ceux-ci sont tres 
proches. 



■3.3. Quatre phas^ ouvertes sont caracterisees pour le 
fragment Sall-Sall-Sall-Salr^ll-Bgli: de 4,8 kb. Elles sont nonunees 
phases 14 a 17 et leurS positions sur! la sequence du fragment de 4,8 
10 kb sont les suivantes ( sur la sequence -5'- 3' des sites Sail vers le 
site Bgll): - 



15 



Tableau : Phases ouv^tes probables du fragment 
Sall-Sall-Sall-Sall-Sall-Bgll^ de 4,8 kb. Les positions sur la sequence 
correspondent aux positions ■ decrites sur la figure 32 ou le brin 
superieur est donne dans son Orientation 5'- 3'. Les phases 15, 16 et 
17 sont codeespar le brin supetieur au contraire de la phase 14 




23 Les repres^tations des probabilites que ces phases 

ouvertes soient codantes, avec parailelentent celles observees sur les 
autres phases (au botal .4) sont pqrtees siilr la figure 34. Les phases 
15, 16 et 17 sont codees par le meme brin, la phase 14 par le brin 
complementaire . , 
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3.4. Quatre phases sent caracterisees pour le fragment 
' Sstl-Sstl-BamHI de 3,9 kb. Elies sont nommees 18 a 21 et leurs 
positions siir la sequence du fragment de 3,9 kb sont portees sur le 
tableau ci-dessous. 

5 Tableau ; Phases ouvertes probables du fragment Sstl-Sstl-BamHI de 3,9 
kb. Les positions sur la sequence correspondent aux positions decrites 
stir la figure 33 ou la polarite du brin superieur est 5'- 3'. Les 
phases 18 et 19 sont codees par le brin inferiexir au contraire des 
phases 20 et 21 . 



10 


Numero de la 
phase 


Codon de 

demarrage 
de traductio: 


Codon 

stop 

i 


Poids moleculaire 
en kD 

de la proteine codee 




IS 


809 


108 


25148 


15 


19 


1971 


1063 


30662 




20 


2099 


3115 


34682 




21 


3344 


3757 


14802 



Les representations des probabilites que ces phases 
ouvertes soient codantes, avec parallelement celles observees sur les 
20 autres phases (au total 4) sont portees sur la figure 35. Les phases 
19 et 20 sont transcrites de fagon divergente. 

3.5. Neuf phases ouvertes sont caracterisees pour le fragment 
EcoR I- Bql ll- EcoR I- Bql ll de 13.1 kb. Elies sont nommees phases 22 a 
30 et leurs positions sur la sequence du fragment de 13,1 kb sont les 
25 suivantes (sur la sequence 5'- 3' du site EcoR I vers le site Bql ll) : 

Tableau: Phases ouvertes probables du fragment EcoR I- Bql ll- Eco RI- Bql ll 
de 13.1 kb. Les positions sur la sequence correspondent aux positions 
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decrites stir la figure 43 ou' le brin sup^ieur est donne dans son 
orientation 5'- 3'. Les phases -22 > 23, ;24/ 25, 26, 27 et 29 sont codees 
par le brin superieur au cdn^aire des. ^ases 28 et 30. 



5 


Num4ro de la 
phase 

de traduction 


Codon de f 
demarrage 


^ Codon 
stop ; 


Poids moleculaire 
en kD 

de la protdine codee 




22 


429 " 


1884 


51 '982 




23 


3364 


3886 


19442 


10 


24 


3892 


4954 


38121 




25 


5060 


8885 


138 055 




26 


9()34 


9676 


24 027 




27 


9678 


10101 


14 990 




28 


10835* 


10306 


21 057 


15 


29 


11656, 


12181 


19 183 




30 


13059 


12368 


24 321 



Les representations des probabilites gue les phases ouvertes 22, 23, 

24, 25, et 26 soient codantes , avec paralleleinent celles observees sur 
les autres phases (au total 5 phkses) sont portees sur la figure 45. 

20 Ces 5 phases sont codees par le meme brin. 

KXKMPLE 4 - Etudes genetiques sur les fragments d'AlW portant des 
genes cob 

Get exemple montte la relation gui existe entre les 
differentes phases ouvertes ' identifiees precedemment et les genes 
25 iropligues dans la biosynth^e des cobalamines et/ou des cobamides 
portes par ces memes fragments. Ces g^es sont identifies par une 
etude genetique coinme decrit ci-dessous. 

4.1 - Etude geheti^e du fragn^t de 5,4 kb 
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Le plasmide pXL723 est le plasmide pRK290 (Ditta et , 
1980) contenant le fragment EcoR I- Hind lll de 2264 pb, correspondant a 
la partie droite du fragment etudie, clone au site Eco RI du pRK290 
(figure 11). La construction des autres plasmides utilises dans cette 
5 etude (pXL302, pXL1397, pXL545, pXL545Q, pXL556 et pXLISOO) est 

decrite dans la legende des figiires 11 et 12« 

Des insertions ont ete obtenues sur le plasmide pXL723 en 
utilisant la technique de Bnaijn et Lupski, 1984. Les insertions du 
transposon Tn^ sur le plasmide pXL723 ont ete selectionnees/ puis 
10 cartographiees dans le fragment de 5,4 kb (figure 12). Le pXL723 

compl&nente le mutant Cob G572 de Pseudomonas putida et le mutant Cob 
G634 d * Aqrobacter ium tumef aciens . Ces insertions se classent en deux 
groupes d' insertions inactivationnelles: soit celles qui ne pennettent 
plus de complementer le mutant Cob G572, soit celles qui abolissent la 
15 complementation du mutant Cob G634 (figure 12). Les insertions qui 
inactivent la complementation du mutant G572 sont cartographiees dans 
la phase ouverte 4 (il s'agit des insertions 15, 27, 68, 81 et 97) ; 
la phase ouverte 4 correspond done a un g&rie cob . Celui-ci est nomme 
cobC . Les insertions qui inactivent la complementation du mutant G634 
20 sont cartographiees dans la phase 5 (ce sont les insertions 66 et 107, 

figure 12); la phase ouverte 5 correspond done a un g&ie cob . Celui-ci 
est nomme cobD . Par ailleurs des insertions avec un transposon Tn^Sp^ 
ont ete realisees. Le transposon TnSSp*' a ete construit au laboratoire 
en clonant au site Bam HI du transposon Tn5 (Jorgensen et al,, 1979) 
25 une cassette Bam HI contenant le gene de resistance a la spec tinomy cine 
provenant du plasmide pHP45D (Prentki et Krisch, 1984). Ces insertions 
ont ete faites dans le chromosome de la souche de Pseunomonas 
denitrificans SBL27 Rif**. La souche SBL27 est lane souche de 
Pseudomonas denitrificans dont SC510 derive par plusieurs mutageneses. 
30 SBL27 produit 10 fois moins de cobalamines que SC510 sur milieu PS4. 
Sur 10000 clones de la souche SBL27 Rif^, portant chacun une insertion 
du transposon, plus de 30 d'entre eux avaient perdu la capacite de 
synthetiser des cobalamines. Certains de ces clones possedaient une 
insertion dans le fragment etudie dans cet example. Ces insertions ont 
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ete cartographiees par analyses de restriction selon la methode de 
Southern (Southern, 1975). Les sites d'iinsertions du transposon chez 
ces differents mutants sont portes sur la figure 12. Une de ces 

insertions numerotee 2639 se trouve dans le gene cobC ; cette insertion 
5 est complementee par le plasmide pXL3d2 qui porte un fragment 
contenant le g^e cobC (figure 12). Deux thsertions, nommees 2636 et 
2638, sont dans la phase ouv^te 3. Ces mutants sont blogues dans la 
biosynthese des cobalamines, et ils sont complementes par le plasmide 
pXIi1397 qui ne contient que la phase ouverte 3, mais non complementes 

10 par le plasmide pXL302 qui contient les genes cobC et cobD (figure 

12). Ces deux insertions sont done dans un autre gene. A la phase 
ouverte 3 nous associons le gene cobB . Une insertion 2933 est placee 
dans la phase ouverte 2 ; elle est complementee par le plasmide 

pxi.1500 qui contient la phase ouverte 2 ; cette insertion est non 
15 complementee par le plasmide pXL1397 qui contient le gene cobB et qui 
complemente les deux insertions dans cobs . ll s'agit done ici d'une 
insertion dans un autre gene; a la phase ouverte 2 nous associons un 
gene nomme cobA . 

Une cassette de resistance a la kanamycine provenant du 
20 plasmide pUC4K (Barany et gl,. , 1985) a ete introduite au site Not l du 
fragment £lal (position 0 sur la sequence )-RsaI (position 1686 sur la 
sequence) clone dans uri plasmide pUC8 (Viera et Messing, 1982) ; il 
s'agit du site Not l situe a la position 771 dans la phase 1 (voir la 
sequence sur la figure 7); deux insertions ont ete retenues 
25 correspondant chacune a une orientation differente de la cassette de 
resistance. Ces fra^^ts pditant chacun une insertion de la cassette 
de resistance ont ete dlones- dans le plasmide pRK404 (Ditta et al. ) 
pour donner les plasmides pXL1630 et 1631. Ces plasmides ont ete 
introduits par transfert conjugatif dans la souche de Pseudomonas 
30 denitrificans SC510 Rif'*, puis par une serie de cultures-dilutions en 
absence de I'antibiotique sSlectif pour le plasmide (la tetracycline), 
des doubles recombinants ayant echange le fragment plasmidique avec le 
fragment chromosomique et ayant perdu le plasmide ont ete trouves. 
Deux souches ont ainsi etS^' caracterisees : 

35 i) I'une est nommee SC510:1631 Rif*', dans cette souche, la 
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cassette de resistance k la kanamycine se trouve inseree, dans le 
chromosome au site Not l (se trouvant dans la phase 1); les polarites 
des transcriptions du gene de resistance a la kanamycj.ne et celle de 
la phase ouverte 1 sont opposees, 

5 ii) I'autre insertion est nommee SC510:1630 Rif''; la 

cassette de resistance est insiree au mime site, mais la transcription 
du gene de resistance a la mime polarite gue celle de phase ouverte 1 
entiere. 

Ces deux souches ont toutes les deux un taux de synthese 
10 de cobalamines au moins 100 fois inferieur a celui de SC510. 

Le plasmide pXL545Q correspond au plasmide pXL545 dans leguel la 
cassette de resistance a la spectinomycine, du plasmide pHP45Q a ete 
inseree au niveau du site BamH I . Ce plasmide (figure 12) gui contient 
le fragment Cla l- Hind lll de 814 pb (ou seule la phase ouverte 1 est 
15 entiere) complemente seulement le mutant 80510:1630 Rif'. Ceci suffit 
i definir un nouveau gene puisgue ce mutant est complemente par un 
plasmide gui contient uniguement . la phase ouverte 1 entiere. La phase 
ouverte 1 correspond a un gene de la voie de biosynthese des 
cobalamines et/ou des cobamides. Ce gene est nomme cobE . L'absence de 
20 complementation du mutant 80510:1631 Rif' par le plasmide pXL545Q est 
peut itre due au fait gue les genes cobA . cobB . cobC . cobD et cobE . ou 
une partie d'entre eux, appartiennent au mime operon et gue 
1' insertion dans cobE gui conserve une transcription dans le sens de 
transcription de 1' operon peut itre complementee seulement par 
25 1' expression en trans du gene cobE . Au contraire le mutant 80510:1631 

Rif' lui ne peut itre complemente gue par un plasmide gui permet 
1' expression en trans des genes cobA i cobE . 

Le fragment Clal- Hind lll- Hind lll- Hind lll de 5,4 kb 
contient done cing genes cob nommes cobA . cobB . cobC . cobD et cobE . 

30 4.2 - Etudes genetigues du fragment de 8,7 kb 

Le plasmide pXL367 est le pRK290 (Ditta et al., 1980) 
nontenant le fragment EcoRI de 8,7 kb clone au site EcoRI (figure 13). 

Des insertions du transposon Tn§ sur le plasmide pXL367 
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5 



10 



15 



20 



25 



30 



ont ete selectionnees en utilisant la technique deja decrite (de 
Bruijn et Lupski, 1984).’ Les Insertions daps le fragment de 8,7 kb ont 
ete cartographiees . De la meme manidre des insertions du transposon 
T n31ac2 ont ete obtenuek 'selbn la methode deja decrite = (Stachel et 
al., 1985) et cartbgraphieel; 29 insertions du iransposon Tn5 et 13 
insertions du trathspo^n T nSlacZ ont ainsi ete cartographiees. La 
position precise de ces insertions sur le fragment de 8,7 kb est 
portee a la figure 14. Des plasmides, portant chacim une seule 
insertion dans le f ragmen^, ‘ de 8,";^ kb', ont ete introduits par 
transferts conjugatifs dabs les mutants Cob d' Aorobacterium 

tmefaeiens G164, fe609, G6T0, -Geil, Gef2, G613, G614, G615, G616, 
G620, G638. Ces' mutants sont tous complementes par le pXL367. Les 
insertions qui n'e permettent plus la complementation des differents 
mutants ont ete recheirchees. Elies correspondent a une insertion dans 



le gene responsable de la 'comjplementation du mutant correspondant . Les 
resultats des compiementations des differents mutants pour leur 
caractere de production de C'bi»lamines ' (phenotype Cob) sont portes sur 



la figure 14. Si le niutant 



recombine produit moins de trois fois moins 



de cobalamines gue ne produib'le meme rnutadt avec le plasmide pXL367, 



il est considere comme etant hon Complemente. Sur les mutants etudies, 
G164, G609, G610, G61 i, G612)' g 613, G614, G615, G616, G620, G638, on 
observe huit classes differentes d' insertions inactivationnelles de 
transposons conduisant a xm'^benotype mute. Ces classes caracterisent 
des insertions par I'absenod de CQmpiementation d'un ou plusieurs 
mutants par les plasmides pXLl67 portant ' ces m€mes insertions. Cheque 
classe correspond dbiic a un geiie mute. '(5h observe que les insertions 
appartenant a une meme classe sont pbsitionnees les unes a c5te des 
autres. Huit classes d' insertions sont ainsi observees qui permettent 
de definir huit gdnes. Chagvie' classe d' insertions definit un fragment 
minimum qui doit etre contenu dahs le' -gene correspondent. La figure 14 
demontre un '^arfait recoupbiiveht ehire les regions delimitees par 
cheque classe, au niveau de la' Carte' de restriction, et les phases 
ouvertes decrites ci-dessus;'(exemple 3). Oii constate en effet que, 
pour cheque classe d' insertions, les 'transposons sont tou jours inseres 
dans une partie du fragment de%,7 est contenue dans une seule 
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phase ouverte. A chague classe d' insertions, est done associee une 
phase oixverte et une seule. Les phases ouvertes indiguees ci-dessus 
codent done chacune pour une proteine impliguee dans la voie de 
biosynthese des cobalamines et/ou des cobamides. Les phases ouvertes ^ 

3 correspondent chacune a des genes impligues dans la biosynthese des 

cobalamines et/ou des cobamides. Ces phases ouvertes sont appelees ^ 

cobF , cobG. cobH, cobl. cobJ, cobK, cobL et cobM pour les phases 6 a 
13 respectivement . La position de ces genes par rapport a la carte de 
restriction est representee sur la figure 14. 

10 4.3 - Etude gmetigue du fragment de 4,8 kb. 

Le plasmide pXL1558 est le plasmide pRK290 (Ditta et al., 

1980) contenant le fragment HindllX-HindlXI de 12 kb du pXLl54 
(Cameron et al., 1989) clone au site EcoRX du pRK290 (figure 36). La 
construction des autres plasmides utilises dans cette etude (pXL233 et 
13 pXL843) est decrite dans la legende de la figure 36. 

Des insertions Tn5Sp ont ete obtenues sur le plasmide pXL1558. Tout 
d'abord une souche contenant un transposon Tn5Sp a ete construite; 
ceci a ete fait en transformant la souche C2110 (Stachel et al., 1985) 
a I'aide du plasmide pRK2013Tn5Sp (Blanche et al., 1989); le plasmide 
20 pRK2013Tn5Sp ayant me origine de replication ColEl ne se repligue pas 
dans la souche C2110 gui est polA-. Les colonies obtenues apres 
transformation gui sont resistantes a la spectinomycine ont done le 
transposon Tn5Sp dans leur chromosome; me colonie est ensuite 
reisolee, puis 1' insertion du transposon est ensuite transduite a 
23 I'aide du phage PI chez la souche MCI 060 comme cela est decrit 

prec^emment (Miller, 1972). La souche MCI 060 TnSSp est transformee 
par le plasmide pXLl558; le plasmide pXL1558 est ensuite mobilise par ^ 

conjugaison a I'aide du pRK2013 chez C600 Rifr. Des conjugants 
resistants a la tetracycline (pour le plasmide pXLl556) et a la ^ 

30 spectinomycine (pom le transposon) sont ensuite selectionnes ; de tels 
conjugants doivent contenir le plasmide pXL1558 dans leguel le 
transposon TnSSp s' est insere. Des insertions portees sur le plasmide 

pXLl558, et plus pregisement dans le fragment de 12 kb sont ensuite 
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cartographi4es digestion de restriction; 23 insertions sont ainsi 
. obtenues et cartographiees slar le f recent de 12 kb; la position de 
ces differentes insertions sur le fragment est presentee sur la figure 
37. Ces 23 insertions ont ete introduites sur le chromosome de la 
5 souche SC510 Rifr apres transfert conjugatif du p-XLl558: :Tn5Sp, puis 
introduction du plasmide pB751 . Le plasinide pR751 est un plasmide, 
resistant i la trimithoprike, du meme groupe d'incompatibilite que le 
PXL1558 (incl>, Thomas et Smith, 1987). Par culture non selective pour 
le PXL1558 (absence de tetradycline) mais selective pour le pR751 et 
10 le transposon (presence de? tfimethoprime et de spectinomycine ) 
I'echange de la mutation’ ' portee ^ par le pXL1558::Tn5Sp avec le 
chromosome ainsi que la segi^egation du pXLI 558 sont obtenus par la 
technique d'echange de marqueur par double recombinaison homologue 
comme cela est deja decrit ' tSchell et al., 1988). Les souches ainsi 
15 selectionnees portent le transposon dsms leur chromosome. La double 
recombinaison homologue est verifies par la methods de Southern 
(Southern, 1975). De Cette maniere 23 soiidies SC510 Rifr::Tn5Sp dans 
le fragment de 12 kb ont ete identifiees. 

D' autre part une autre- insertion- Tn5Sp obtenue par mutagenese au 
20 hasard du transposon <Tn5Sp dans la souche SBL27 Rifr (Blanche et al., 
1989) a 4te cartogfaphiee sur le fragment de‘ 12 kb par analyse de 
restriction selon la methods' de Southern (Southern, 1975), voir figure 
37; cette souche est nomm^e S^2 7 Rifr::T^5Sp 1480. 

Le tavuc de synthese de cobalamines est determine pour ces 24 souches 
25 cultivees en milieu PS4 seldh le pfotdcole deja decrit (Cameron et 
al . , 1 989 ) et le phenotype Cob- est attribue aux souches produisant au 
moins 1000 fois moins (resp. 100) de vitamins Bl2 que la souche 
parents SC510 Rifr (resp.SBL27 Rifr), figure 37. 11 est ainsi observe 
que 6 de ces insertions chromipsomiques conduisent a. un phenotype Cob- 
30 Chez P. denitrificans; il s'agit des insertions 31.1, 41.3, 45, 55, 
22.1 et 1480. 

Trois plasmides PXL233, pXL837 (Cameron et al.) et pXL843 sont 
introduits par transfSrts conjugatif s dans trois souches presentant le 
phenotype Cob- sbient SC51Q 'Rifr: :TnSSp 31.1,SC510 Rifr:;Tn5Sp 45, 
SBL27 Rifr::Tn5Sp 1480. Ces trois mutants ont chacun un profil de 
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coiDplenentation different pour la synthese des cobalamines. En effet 
SBL27 Rifr: :Tn5Sp 1480 est complenente par le pXL837 et le pXL843 mais 
pas par le pXL233; le mutant SC510 Rifr::Tn5Sp 45 n'est complemente 
que par le pXL843; le mutant SC510 Rifr::Tn5Sp 31.1 est compl^ente 
5 par Le plasmide pXL843 ainsi que par le plasmide pXL233 (voir figiure 
37). Les donnees presentees permettent done, d'apres les resultats sur 
les compl&nentations des trois mutants, de conclure que les trois 
mutants sont differents et que pour chacun d'entre eux, le transposon 
Tn5Sp s' est insere dans un gene cob different. 

10 D'autre part les plasmides pXL1558: :Tn5Sp 41^3, pXL1558: :Tn5Sp 45, et 
pXL1556: :Tn5Sp 22.1 sont introduits par transferts conjugatifs dans la 
souche G2035 (Cameron et al., 1989) et ne la complementent pas. Le 
plasmide pXL1558 compl^ente ce mutant au contraire du plasmide 
PXL155B: :Tn5Sp 31 .1 . 

13 Les donnees de ph^otype et complementation nous permettent de definir 
3 classes d' insertions; chacune de ces classes est representee par les 
insertions suivantes : 31.1, classe 1; 45, 41.3, 55 et 22.1, classe 2; 
1480 classe 3. 

Pour chaque classe d' insertions, les transposons sont toujours inseres 
dans une partie du fragment de 4,8 kb qui est contenue dans une seule 
phase ouverte (ORF14, ORF16 et ORF17, comme definies a 1' example 3). A 
chaque classe d' insertions est associee une seule phase ouverte. Les 
phases ouvertes indiquees ci-dessus codent done poiir une proteine 
impliquee dans la voie de biosynthese des cobalamines et/ou des 
cobinamides. Ces phases ouvertes sont appelees cobX, cobS et cobT pour 
les phases 14, 16 et 17. La position de ces genes par rapport a la 
carte de restriction est repr6sentee sur la figure 37 . La phase 
ouverte 15 n'est pas un gene implique dans la biosynthese du coenzyme 
B12. 

30 4.4 - Etudes genetiques du fragment de 3,9 kb 

Le plasmide pXLl557 est le plasmide pRK290 (Ditta et al., 
1980) contenant le fragment Hindlll-BamHI de 9 kb du pXL519 clone au 
site EcoRI du pRK290 (figure 38). La construction des autres 
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plasmides utilises dans cetjte; etude (pXLt^86, pXL1303, pXL1324) est 
decrite dans la legends de la figure 38. Par aillevirs, le fragment 
Bglll-xhol de 2 kb (positions sur la sequence presqntee figure 33 251 
et 2234) du plasmide pXL519 est clone -aux sites BamHI-Sall du plasmide 
5 pXli435 (Cameron et al) pour generer le plasmide pXL699. 

Des insertions TnSSp ont ete bl?tenues sur le plasmide pXLl 557 selon la 
technique decrite ds^ l'exei5ple 4.3. Les insertions du transposon 
Tn5Sp sur le plasmide pXL1557, alors nommees p^1 557 :: TnSSp, ont ete 
selectionnees . Celles qui sont cartographiees dans le fragment de 9 kb 
10 (figure 39) ont ete introduites sur le chromosome de la souche SC510 
Rifr apres transfert conjugatif du pXLI 557 :: TnSSp. et echange de 
marqueur par double recombinaison homologue comme cela est decrit en 
4.3. 

La double recombinaison homologue est verifies par la methods de 
15 Southern (Southern, 1975)., De cette mani&:e 20 souches SC510 
Rifr::Tn5Sp ont ete identifiers. 

D' autre part deux autres insertion TnSSp pbtenues par mutagenese au 
hasard du transposon TnSSp dai^ la souche SBL27 Rifr (Blanche et al., 
1989) ont ete cartographiees sur le fragment de 9 )ib par analyse de 
20 restriction selon la methods de Southern (Southern, 1975), voir sur la 
figure 39 les insertions 1003 et 1147. 

Le taux de synthese de cobalamines est determine pour ces 22 souches 
cultivees en milieu PS4 selon le protocols deja decrit (Cameron et 
al., 1989) et le phenotype Cob- est attribue aux souches produisant 
25 1000 fois moins (resp. 100). de vitamine B12 que la souche parente 

SC510 Rifr (resp.SBL27 Rifr), figure 39^ Seules les 4 insertions 1, 
1003, 23 et 1147 se traduisent par, un phenotype Cob- chez P. 

denitrif leans. 

Quatre plasmides pXL699, pXLt286, pXLl303 et pXL1324 sont introduits 
30 par transferts con jugatifs dans les quatre souches presentant le 
phenotype Cob- soient SC510 Rifr::Tn5Sp 1, SBL27 Rifr::Tn5Sp 1003, 
SC510 Rifr::Tn5Sp 23 et SBL27 Rifr::Tn5Sp 1147. Le plasmide pXL699 
complements les deux premiers mutants (SC510 Rifr::Tn5Sp 1, SBL27 
Rifr::Tn5Sp 1003) mais le plasmide pXL1303 ne les complements pas; le 
35 plasmide pXL1324 comp^m^te les deux autres mutants (SC510 
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Ri£r::Tn5Sp 23 et SBL27 Rl£r: :Tn5Sp 1147) mais le plasmide pXLl286 ne 
■les complemente pas. 

D' autre part le plasmide pXL1557: :Tn5Sp 1, est introduit par trans£ert 
conjuguatif dans la souche G2040 et ne la complemente pas alors gue 
3 les plasmides pXL1557, pXLl557: :Tn5Sp 6A, pXL1 557: :Tn5Sp 54, 
PXL1557: :Tn5Sp 48, pXL1557: ;Tn5Sp 21, pXLl 557: ;Tn5Sp 8, pXL1557: :Tn5Sp 
23 aussi introduits par trans£erts conjugati£s, la complementent (voir 
figxire 39) . 

Les donnees de phenotype et complementation permettent de 
10 de£inir 2 classes d' insertions. Pour chague classe d' insertions, les 
transposons sont tou jours inseres dans une partie du fragment de 3,9 
kb gui est contenue dans une seule phase ouverte (ORF 19 et 0RF20 
comme definie a 1' example 3). 

A chague classe d' insertions est associee une seule phase ouverte. Les 
15 phases ouvertes indiguees ci-dessus codent pour une proteine impliguee 
dans la voie de biosynthese des cobalamines et/ou des cobinamides. Ces 
phases ouvertes sont appelees cobV et cobU pour les phases 19 et 20. 
Les phases 18 et 21 ne sont pas des genes impligues dans la voie de 
biosynthese du coenzyme B12. La position de ces genes par rapport a la 
20 carte de restriction est representee sur la figure 39. Les insertions 
48, 21 et 8 sont cartographiees entre les genes cobU et cobV 

4.5 - Etudes genetigues du f ra gment de 13,4 kb. 

4.5.1. Etudes sur le fragment EcoRI - Bol II de 4327 pb. 

Le plasmide pXLl89 (Cameron et al., 1989), gui contient au moins un 
23 gme cob porte un insert de 3.1 kb gui excepte 300 pb correspond a un 
fragment EcoR I- Cla l de 4,26 kb (voir figure 45). Le pXLl89 a ete soumis 
a une mutagenese au transposon Tn^, comme cela est decrit precedemment 
(De Bruijn et Lupski (1984). 13 insertions ont ainsi ete cartographiees 
dans I'insert du pXLl89 comme cela est presente sur la figure 46. Ces 
30 13 plasmides mutants ainsi gue pXLl89 ont ete conjugues chez deux 
mutants d'A. tumef aciens . G632 et G633, gui sont des mutants 

complementes par pXL1B9 (Cameron et al., 1989). Seule 1' insertion 58 
s' est averee etre une insertion inactivationnelle . Ce resultat montre 
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que les deux mutants 6632 et ’c633 correspondent a une mutation dans un 
meme gaie et que d' autre part le seul rgine" 'de P. denitrlfirans qui 
puisse etre responsable de leur complementation correspond a la phase 
ouverte 26 (voir figiire 46) ' i^sque 1' insertion 56 est cartographiee 
5 dans cette phase ouverte; de plus il s'agit de la seule insertion parmi 
les 13, qui est cartd^aphieS dans' cette phase ouverte. Un gene cob , 
nomme cobO est done associe S la phase' ouverte 26. 

Pour savoir si les quatre autres phases ouvertes (phases ouverte 27 a 
30) identifiees sur ce f raiment correspondent a des genes c^, une 
10 cassette de resistance a’la spectinomycine, du plasmide pHP45Q (Prentki 
et Krisch, 1984) a ete spibifiquemerit dans chacun de ces genes 

puis introduite dans le cl^b^Osome de P. denitrif ieans SC510 Rif^ par 
recombinaison homologue de maniere a obtenir des mutants d' insertions 
dans chacune de ces phases’ ouvertes. ^our ce faire, le fragment 
15 EcoRl-cial (positions respectives 8818 et 13082 sur la sequence 
presentee sur la figure 43) a ete utilise, Ce fragment, qui porte les 
phases ouvertes 27 S 30, a etS purifii a partir du pXL157 (Cameron et 
al., 1989); un linker EgoRI a ete ajbiite Sur I'ixtremite Cla l apres que 
celle-ci ait ete remplie par le fragilinit Klenow de I'ADN polymerase 
20 d'E. fioli. Ce fragment a ensuite j§ts clone dans le plasmide pUC13 
(Viera et al., 1982) au site EcoR I . Le plasmide ainsi construit a ete 
appele pXL332. Des insertions de la cassette de resistance a la 
spectinomycine du plasmide pHP45n IPreAtki et Krisch, 1984) ont ete 
rdalisees sur le pXL332. Ces insertions opt ete f sites sepaurement aux 
25 sites §mal (position 9868, ptose ouverte 27), BamH i (position 10664, 
phase ouverte 28), giai (position 11687, phase ouverte 29) et Neo i 
(position 12474, phase ouverte 30)« par ■digistions totales ou partielles 
du PXL332 avec ’ les enzyme^ correspondantes puis, si cela est 
necessaire, remplissage de ces extrendtes avec le fragment de Klenow de 
30 I'ADN polymerase d'E. £oli, puis ligati|re avec le fragment de Sma l 2 kb 
du pHP45o (Prentki at Krisch,.. 1984) ephiehant uh gpne de resistance a 
la spectinomycine; ces insertions sdnt npmmees respectivement n2, n1 , 
q 3 et o4 comme cela esf preseiite sto ia figure 46. Les fragments EcoRI 
portant ces differentes insertions ont epsuite ete clones sur le pRK404 
35 (Ditta et al., 1985) a I'un des deu^ sites EcoRI. Les 4 plasmides 
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portant ces differentes insertions ont ensuite ete introduits par 
conjugaison chez SC510 Rif^^ comme cela est decrit precedemment . Le 
plasmide pR751 (Thomas et Smith, 1987) a ensuite ete introduit dans les 
transcon juguants . L'echange des mutations portees par les 4 differents 
5 derives de pRK404 et le chromosome de SC510 Rif^ a pu etre selectionne 
comme cela est decrit (voir example 4.3). 4 souches ont ainsi ete 

obtenues. Ces souches portent chacune vne insertions de la cassette de 
resistance dans une des guatre phases ouvertes 27 a 30. Ces insertions 
ont ete verifiees par analyse de I'ADN genomigue par Southern blot 
10 (Southern, 1975). La production de cobalamines de ces differentes 
souches a ete etudiee . Elies ont toutes montre un phenotype Cob^t- par 
culture en milieu PS4 . Ce resultat indigue gue ces phases ouvertes 
n'interviennent pas dans la biosynthese du coenzyme B12. Toutefois il 
est possible gu'une ou plusieurs de ces phases codent pour des 
15 proteines gui interviennent par example dans la transformation du 
coenzyme B12 en methylcobalamine par exemple, c'est a dire la synthese 
d'une autre cobalamine voir d'\an autre corrinoide. 

4.5.2 Etude du fragment EcgRI-EcoRI de 9.1 kb. 

Differents plasmides sont utilises dans cette etude; 

20 le plasmide pXLl560 est le plasmide pRK290 (Ditta et al., 1980) 

contenant le fragment EcgRI-EcoRI de 9,1 kb kb du pXL156 (exemple 1) 

clone au site EcoR I du pRK290 (voir figure 46). La construction des 

autres plasmides utilises dans cette etude (pXL618, pXL593, pXL623, 

PXL1909, PXL1938, pXLl908, pXL221, pXL208, pXL297) est decrite dans la 

25 legende de la figure 45. 

Des insertions Tn5Sp ont ete obtenues sur le plasmide pXLl560. 
La souche MCI 060 TnSSp transformee par le plasmide pXL1560 a servi a 
obtenir des insertions du transposon TnSSp dans le fragment pXL1560; 27 

insertions ont ainsi ete obtenues et cartographiees sur le fragment de 
30 9,1 kb; la position de ces differentes insertions sur le fragment est 

presentee sur la figure 4. Ces 27 insertions ont ete introduites sur le 
chromosome de la souche SC510 Rif^ apres transfert conjugatif des 
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PXL1560: ;Tn5Sp, puis int^oduc^©n du plasmide pR751.,Le plasmide pR75l 
est un plasmide, resistant -I . la trimethpprime, du meme groups 
d' incompatibilite que le pXL156,0 (incB, Thomas et Smith, 1987). Par 
culture non selective, pour , le pXLI 560 (absence de tetracycline) mais 
5 selective pour le pR751 &t le .transposon (presence de trimethoprime et 
de spectinomycine) 1 ' echang^^^?- de la mutation portee par le 

pXLl560: :Tn^Sp avec le chrompSplcje- ainsi que la segregation du pXL1560 
sont obtenus; cette techniqi^e^vd'echange de marquevir par doxible 
recombinaison homologue est equi^alfnte a celle deja deprite par Schell 
10 et al., 1988. Les -souches airisi -selectipjages portent le transposon 
dans leur chromosome. 

La double recombinaison homologue est ' verif iee par la methods de 
Southern (Southern, 19,75). pe cette maniere 27 souches SC510 
Rif^::Tn5Sp possedeuit chacun^ une insertion differente du transposon 
15 TnSSp dans le fragment de 9.1 kb- ont eti idehtifiees. 

Le taux de synthese de cobalamihes est determine pour ces 27 
souches cultivees en milieu PS4, et le phenotype Cob” est attribue aux 
souches produisant au moins 1000 fpis mpins de vltamine B12 que la 
souche parents SC510 Riff, figi^e 46. 11, est ainsi observe que 18 de 
20 ces insertions chromosOrndgues ; sur . les. 27, conduisent a un phenotype 
Cob- chez P. denitrif icans comme. cela est montre sur la figure 46. 

Les insertions 19, 32, 24, 27, 37, 39, 26, U;et 14 sont partographiees 
dans la phase ouverte 22 (voir figure 46). Toutes ces insertions sont 
complementees par le plasmide pXL6 16 qui ne contient que la phase 
25 ouverte 22. Nous en didUisons ,|gue' la phase ouverte 22 correspond a un 
gene cob que nous appelons cobO . Aucune insertion n'a ete obtenue dans 
la phase ouverte 23; cependaht. le plasmide pXL623 qui ne contient que 
cette phase ouverte (voir figure 46), complements deUx mutants cob 
d^ Aqrobacterium tumefaciens . G642 et G2043 (Cameron et al., 1989). La 
30 phase ouverte 23 correspond done a un gene cob nomme cobP . Les 
insertions 23, 13, 12, 30, 22, 40, 35, 10 et 17 qui sont cartographiees 
dans les phases ouvertes 24 et 25 entrain^t un phenotype Cob- chez 
SC510 Rif^, Zl semble done qu'il s'agisSe .de: deux , phases ouvertes dont 
le produit est implique dans la biosynthese des cobalamines . Toutef ois 
35 on ne peut exclure que' ces insertions ai^t des effets polaires sur les 
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g&ies positionnes en 3' tels que cobO , II convient done d'etudier la 
complementation de ces mutants afin de voir si leur phenotype Gob- ne 
resulte pas d'xan effet polaire. 

Les mutants Cob Aarobacterium tumefaciens G622, G623 et G630 

3 compl&nentes par le pXL156 ont ete etudies. Ces mutants ne sont pas 
complementes par le plasmide pXL1B9 (Cameron et al., 1989) gui contient 
cobO comme seul gene cob. Au contraire ils sont complementes par le 
plasmide pXLl908 qui contient cobO et la phase ouverte 25 en plus des 
phases ouvertes 27 a 30 (voir figure 45). Ces dernieres ne peuvent etre 
10 responsables de la complementation de ces mutants puisque les proteines 
pour lesquelles elles codent n' interviennent pas dans la voie du 
coenzyme B\2- Les compl&nentations observees ne peuvent done etre que 
le seul fait de la phase ouverte 25. De plus les mutants SC510 Rif^ 
TnSSp cartographies dans cette meme phase ouverte (il s^agit des 
13 mutants 22, 40, 35, 10 et 17) sont complementes par le plasmide 

pXL1908, voir figure 46, (portant cobO et la phase 25) alors qu'au 

moins deux d'entre eux ne sont pas complementes par le pXL189 qui ne 
contient que cobO comme gene cob . Ces resultats montrent clairement que 
la phase ouverte 25 est xm gene cob ; ce gene cob est nomme cobN . 

20 Les mutants SC510 Rif^ TnSSp 23, 13 et 12, qui ont le phenotype Cob-, 

sont cartographies dans la phase ouverte 24. Ces mutants ne sont pas 
complementes par le plasmide pXL623 qui ne contient que le gene cobP . 
Au contraire ces mutants sont complementes par le plasmide pXL593 qui 
contient cobP et la phase ouverte 24 ce qui indique que la phase 

23 ouverte 24 est responsable de leur complementation. La phase ouverte 24 
est done un gene cob qui est nomme cobw . 

EXEMPLE 5 - G^BS et proteines. 

5.1 - Fragment de 5,4 kb 

Cinq genes ( cobA. cobB. cobC> cobP et cobE ) sont done 
30 definis sur le fragment Clal- Hind lll- Hind lll- Hind lll de 5,4 kb. Ils 
codent respectivement pour les proteines COB suivantes: COBA, COBB, 
COBC, COBD et COBE. Les parties codantes des genes ( cobA a cobE ) sont 
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decrites a la figure 15, ainSi qufe les sequences des proteines COBA a 
COBE. Oes proprietes de chacime de ces proteines sont aussi presentees 
(composition en acides amineis, point isoel^ctrlque, index de polarite 
et profil d'hydrophilicite) . 

3 5.2 - Fragment de 8,7 kb 

Huit graes sont done definis sur le fragment de 8,7 kb. 
Ces genes cobF a cobM , codent r^pectivement pour les proteines COB 
SUivantes : COBF, COBG, COBH, COBI, COBJ, COBK, COBL, COBM. Les 

parties codantes des genes ( cobF a cobM ) sont decrites sur la figure 
10 16, ainsi que les sequences des proteines COBF a COBM. Des proprietes 

de chacune de ces proteines sont aussi presentees (composition en 
acides amines, poids moleculaire , point isoelectrique, index de 
polarite et profil d'hydrophilicite). 

t 

5.3 - Fragment de 4,8 kb 

15 Trois genes (cObX , cobS, cobT) sont definis sur le 

fragment Sall-Sall-Sall-Sall-Sall-Bgll de 4,8 kb. Ils codent 
respect ivement pour les proteines suivantes: COBX, COBS et COBT. Les 
parties codantes de ces genes sont decrites sur la figure 40, ainsi 
que les sequences des proteines CX)BX, CObs- et COBT. Arbitrairement, 
20 I'ATG a la position 1512 de cdbS a ete choisi comme Coddn d' initiation 
plutot que celui situe a li^ position 1485 (voir figure 32). Des 
proprietes de chacune de ces proteines sont aussi representees 
(composition en acides amines, point isoelectrique, index de polarite 
et profil d' hydrophobic! te) . COBT presfente une poche hydrophile 
25 correspondant aux acides amines 214 a 385. 

5.4 - Fragment de 3,9 kb 

Deux g&ies (cobO et cobV) sont definis sur le fragment 
Sstl-Sstl-BamHI de 3,9 kb. Ils codent respectivement pour les 
proteines suivantes: COBU et COBV. Les parties codantes de ces g^es 
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sont decrites sur la figure 41, ainsi que les sequences des proteines 
COBU a COBV. Des proprietes de chacune de ces proteines sont aussi 
representees (composition en acides amines, point isoelectrique, index 
de polarite et profil d'hydrophobicite) . 



3 5.5 - Fragment de 13,4 kb 

Cinq genes cob sont definis sur le fragment de 13.4 kb ( cobO > cobP , 

cobw . cobN et cobO et cobV ) . Ils codent respectivement pour les 
proteines suivantes: COBQ, COBP, COBW, COBN et COBO. Les parties 

codantes de ces genes ( cobO, cpbP, cobW . cobN et cobO l sont decrites 
10 sur la figure 46, ainsi que les sequences des proteines COBQ, COBP, 
COBW, COBN et COBO. Des proprietes de chacune de ces proteines sont 
aussi representees (composition en acides amines, point isoelectrique, 
index de polarite et profil d'hydrophobicite) . 

D'apres les profils d'hydrophilicite, qui ont ete realises 
15 suivant les programmes de Hopp et Woods (1981), toutes les proteines 
COB, a 1' exception de COBV, sont vraisemblablement des proteines 
solubles, par opposition a des proteines membranaires, puisque I'on 
constate 1^ absence de grands domaines hydrophobes. COBV est soit une 
proteine membranaire, puisque I'on constate 4 longs domaines 
20 hydrophobes (voir figure 41 ) soit une proteine cytoplasmique ayant 
d'importants domaines hydrophobes. 

Pour toutes les sequences en acides amines des proteines 
COB, il est indique comme premier acide amine en position 
NH 2 -terminale une methionine. Il est entendu que celle-ci peut etre 
25 excisee in vivo (Ben Bassat et Bauer, 1984). On sait que des regies 
concemant 1' excision in vivo de la methionine NH 2 -terminale par la 
methionine aminopeptidase ont ete proposees (Hirel et 1989). 

Par ailleurs, ces sequences proteiques ont ete comparees 
aux proteines de Genpro, qui est une extraction proteique de Genbank 
(version 59) augmentee des parties codantes putatives superieures a 
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200 acides amines, suivant le programme de Kanehisa (1984). Aucune 
homologie significative n'a pu etre mise en evidence avec les 
parametres utilises sur la version 59 de Genbank, sauf pour COBT. En 
effet, la proteine COBT presente un “core d'acide amines acides** entre 
^ les positions (en acides amines) 224 et 293 (voir figure 40); dans 
cette portion de la proteine, plus d'un acide amine sur 2 est un 
residu acide glutamique ou aspartigue; ce noyau d' acides amines acides 
rend la proteine homologue sur cette region, suivant le programme de 
Kanehisa (1984), a d'autres proteines ayant elles aussi un tel noyau 
10 acide. Les proteines les plus homologues sont : la proteine GARP de 
Plasmodium falciparum (Triglia et al., 1988), la troponine T cardiague 
du rat (Jin et Lin, 1989i), la prothymosine humaine et de rat 
(Eschenfeld et Berger, 1986), une proteine du rat androgene -dependant e 
se liant a la spermine (Chang et al., 1987), les proteines **mid-size 
15 neurofilament subunit** humaine, de rat et de poulet (Myers et al., 
1987, Levy et al., 1987, Zopf et al., 1987). La f onctionalite de ces 
noyaux riches en residue acides n' est pas connue; cependant ce noyau 
acide devrait soit permettre la fixation de cation metalligues tels 
que le Co++, ce qui rendrait a la proteine COBT xin role de 
20 metallothioneine a cobalt, ou bien permettre des interactions avec 
d'autres proteines. 

EXEMPLE 6 - Etudes enzymatiques 

6.1 - Identification de proteines COB et de leurs g^es a 
partir d'activites enzymatiques 

Get exemple decrit comment, a partir d'une proteine 
purifiee, apres avoir etabli sa sequence NH 2 -terminale, il est 
possible de trouver le gene de structure correspondent parmi des genes 
cob sequences. 

6.1.1. Identification de la proteine COBA codee pax le 
La purification de la SUMT de Pseudomonas denitrif leans a 




30 gene cobA 
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ete decrite (F. Blanche et , 1989). La s&jufence NH 2 -terminale de la 
proteine ainsi purifiee a pu etre realisee selon la technique decrite 
ci-dessus. Les dix premiers acides amines ont ete identifies : 

1 2 3 4 5 -6 7 8 9 10 

5 Met He Asp Asp Leu Phe Ala Gly Leu Pro 

La sequence NH 2 -terroinale de la proteine COBA (figxire 15) 
correspond exactement a cette sequence. Le poids moleculaire de la 
SUMT purifiee estime par electrophorese PAGE-SDS a 12,5 % est de 30 
000. La proteine COBA a un poids moleculaire deduit de sa sequence de 
10 29 234 (figiire 15). Les correspondances entre les sequences 

NH 2 -terminales et les poids moleculaires indiquent clairement que la 
proteine COBA correspond a la SUMT. Le gene cobA est le gene de 
structure de la SUMT. 

6.1.2. Identification de la proteine COBB codee par le 

15 g&ie CobB 

a) Dosage de I'activite acide cobyrinique a.c -diamide synthase 

Cet example illustre le dosage d'une activite de la voie 
de biosynthese des corrinoides qui n'a encore jamais ete decrite. II 
s'agit de 1' acide cobyrinique a.c -diamide synthase (ACDAS) qui 
20 catalyse I'amidation de deux fonctions acides carboxyliques du noyau 
corrine ou descobaltocorrine aux positions ^ et c (figure 17). Le 
donneur de groupement NH 2 est la L-glutamine et la reaction consomme 1 
molecule d'ATP par amidation de chaque fonction acide carboxylique . Le 
dosage qui est decrit ci-dessous s 'applique a la reaction de 

25 diamidation de 1' acide cobyrinique; avec quelques modifications 

{detection en CLHP a 330 nm en particulier) il s' applique a la 

reaction de diamidation de 1' acide hydrogenobyrinique. 

Le melange d' incubation (250 \il de tris-HCl 0,1 M pH 7,6) 
contenant ATP (1 mM), MgCl 2 (2,5 mM), glutamine (1 mM), acide 
30 cobyrinique (25 pM) ou acide hydrog^obyrinique (5 ^M), cobyrinique 

a.c -diamide synthase (environ 1 unite d' activite) est incube durant 1 
heure a 30 ''C. A la fin de 1' incubation, 125 pi d'une solution aqueuse 
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de KCN (2,6 g/l) et 125 pi d'HCl 0,2 M sont ajoutes au melange gui est 
ensulte chauffe i 80 *C pendant 10 minutes puis centrifuge 5 minutes a 
5 000 g. 50 pi du surnageant Be centrifugation sont analyses en CLHP. 
Ils sont injectes sur une cblohne Nucleosil 5-Cig de 25 cm et elues 
3 avec un gradient, de 0 a 100 % de tampon B dans A en 30 minutes ; 
tampon A : phosphate de potassium 0,1 M pH 6,5, 10 mM KCN ; tampon B : 
phosphate de potassim 0^1 M pH 8, 10 mM KCN/acetonitrile (1/1). Les 
corrinoides sont detectes grace a leiir absorption UV a 371 nm. L' unite 
d'activite enzymatigue est definie comme la guantite d' enzyme 
10 necessaire pour synthetiser 1 nmole de grbupements amides par heure 
dans les conditions decrites;. 

b) Purification de I'activite acide cobyrinigue a,c-diamide synthase 
de Pseudomonas denitrificans 

Cette experience, illustre comment une proteine de 
15 Pseudomonas denitrificans intervenant dans la voie de biosynthese des 
cobalamines peut etre purifiee. 

A partir du dos^e decrit a l^exemple 6.1.2 a), la 

purification de 1' acide cpbyrinig^ a,c -diamide synthase de 

Pseudomonas denitrificans est' tealisee coipie decrit ci-dessous. 

20 Dans une experience typi<^e de purification, 7 g de 

cellules humides de la souche SC 510 Rif ^dans laguelle on a introduit 
le plasmide pXLlSOO (vo^r example 4.1. pour la description du pXL1500 
ainsi gue la figure 12)‘ sont suspendues dans 30 ml de Tris-HCl 0,1 M 
pH 7,7 et soniguees duranj;, 15 minutes a 4*C. L' extrait brut est 

25 ensuite recupere par centrifugation 1 heiire a 50 000 g puis 10 ml de 

cet extrait sont injectes sur une polonne de Mono Q HR 10/10 
eguilibree avec le meme tampon. Les ^ proteines sont eluees avec un 
gradient lineaire de KCi (0 a 0,5 M) , Les fractions contenant 

I'activite enzymatigue sont siegroupeeS. et concwtrees a 2,5 ml. Apres 
dilution avec 1 ml de Tris-HCl 25; mM pH 7,7, les proteines sont 
fractionnees sur une Mono 'Q HR 5/5 en utilisant le gradient de KCI (0 
a 0,5 M) precedent. Les fractions ‘actives sont regroupees, 1 ml de 
Tris-HCl 0,1 M pH 7,7 conteh^t 1,7 M de sulfate d' ammonium est ajoute 
a I'echantillon gui est e^uite chrbmat^graphie sur. une colonne de 

i ■ 

• ¥ •• 
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Phenyl-Superose (Pharmacia) avec un gradient decroissant de sulfate 
d'ammonium (1,0 H a 0 H) . Les fractions contenant I'activite 
recherchee sont rassemblees et chromatographiees sur une colonne 
Bio-Gel HPHT (Bio-Rad) avec un gradient de phosphate de potassium (0 a 
5 0,35 M). 

Apres cette etape, 1' enzyme est pure a plus de 95 %. Elle 
ne presente aucune proteine contaminante en PAGE-SDS. La purete de la 
proteine est confirmee par I'unicite de la sequence NH 2 -terminale . Son 
poids moleculaire dans cette technique est de 45 000. Les differentes 
10 etapes de purification de I'ACDAS, avec leur facteur de purification 
et leur rendement sont portees sur le tableau ci-dessous. 

Tableau : Purification de I'ACDAS 



16 



20 



^ce facteur est calcule d' apres 1' augmentation de I'activite 
specifique des fractions au cours de la purification. 

c) Sequence NH 2 -terminale de I'acide cobyrinique a . c -diamide synthase 
25 de Pseudomonas denitrificans et identification du gene de structure de 
Pseudomonas denitrificans codant pour cette activite 

Get example illustre comment la sequence NH 2 -terminale 
d'line proteine gui intervient dans la voie de biosynthese des 
cobalamines permet d' identifier le gene de structure qui code poiir 



Et.ape de 

purification 


vol 

(ml) 


•Pr vtei'ne£> 
(mg) 


Activity. ,spe. 
(u/mg de 

protdines) 


Rendement 


Facteur de 
purification^ 


Extrait brut 


10 


200 


8.5 


- 




MonoQ 10/10 


12 


15.1 


108 


96 


12.7 


MonoQ 5/5 


3 


3.75 


272 


60 


32 


Phenyl - Super ose 


1 


0.865 


850 


43 


100 


Bio-Gel HPHT 


2 


0.451 


1320 


35 


155 
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cette proteine. 

La science NH 2 -terminale de ^I'acide cobyrinique 

a/C -diamide synthase de Pseudomonas denitrificans purifiee conune 
decrit a 1' example 6.1.2 bl'a ete realisee comme decrit precedemment . 

5 15 residus ont ete identifies 

■> 2 3 4 5 6 7 8, 9 10 11.12 13 14 15 

Ser Gly Leu Leu He Ala Ala Pro Ala Ser Gly Ser Gly Lys Thr 

La sequence NH 2 -td^inale de la proteine COBB (figure 15) 
correspond exactement a cette sequence, si ce n'est que dans la 
10 sequence presentee sur la figure 15, ime methionine precede la 
sequence peptidique determinee par sequengage direct. Il en resulte 
que la methionine aminoterminale est certainement excisee in vivo par 
la methionine aminopeptidase (Ben Bassat et Bauer, 1987). Le poids 
moleculaire de I'ACDAS purifies estime par , electrophorese PAGE-SDS a 
15 12,5 % est de 45 000. La proteine COBB a un poids moleculaire deduit 

de sa sequence de 45 676 (figure 15). Les correspondences entre les 
sequences NH 2 -terminales et les poids moleculaires indiquent 

clairement que la proteine CQBb correspond a I'ACDAS. Le gene cobB est 
le gene de structure de I'ACDAS. 

20 6.1.3. Identification de la proteine GOBI codee par le 

gene Gobi 

a) Dosage d'une activite S-adenosyl-L-methionine:precorrine-2 methyl- 
transferase 

Cet exemple illustre le dosage d'une activite enzymatique 
25 de la voie de biosynthese des corronoxdes gui n'a encore jamais 4te 
decfite. II s'agit de la S-ad^osyl-L-methionine:-2 methyltransf erase 
(SP 2 MT) gui catalyse le tr^sfert d'un groupement methyl de la 
S-adenosyl-L-methionine (SAM) au precorrine-2 pour donner le 

precorrine-3 (figure 18). Les facteurs II et III, produits d'oxydation 
respectivement du precp]iriney2 et du |a;,ecorrine.-3 ont deja ete 
purifies a partir d' extraits cell^aires de Propionibacterittm 
shermanii (Battersby et MacDonald, ^982, Scott et al . , 1984); le 



30 
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precorrine-2 et le precorrine-3 sont reconnus comme des interm^iaires 
presumes de biosynthese du coenzyme Bx 2 inais ils n'ont jamais ete 
purifies. Pour cette raison, I'activite correspondante n'a jamais ete 
ni dosee, ni purifiee auparavant. Le substrat de la reaction 
5 enzymatique, precorrine-2, est une molecule tres labile gu'il n'est 
pas possible de conserver car elle s'oxyde spontanement en presence de 
traces meme infimes d^oxyg^e (Battersby et MacDonald, 1982). Le 
principe de ce test enzymatique repose done sur la possibilite de 
generer extemporanement, a I'aide d'mi ex trait enzymatique de la 
10 souche SC510 Rif*'dans laquelle on a introduit le plasmide pXL1500, le 
precorrine-2 a partir du SAM et d'acide 6-aminolevulinique. 
L'inciabation doit etre effectuee en conditions de stricte anaerobie. 

Les fractions contenant la SP 2 MT sont incubees dans 1 ml 
de Tris-HCl 0,1 M pH 7,7 en presence de 5 mM DTT, 1 mM EDTA, 100 ^iM 
15 [ methyl "^H]“ SAM (1 pCi), 0,8 mM acide 5-aminolevulinique et 6 mg 

d' extrait enzymatique brut de la souche de Pseudomonas denitrif icans 
SC510 Rif^ pXLVSOO pendant 3 heures a 30 ®C. La souche SC510 Rif^ 
pXLl500 contient une forte activite SUMT (F. Blanche et , 1989). 
Les composes tetrapyrroliques produits durant 1^ incubation sont fixes 
20 sur une colonne d'echangeur d' anions DEAE-Sephadex et esterifies dans 
le methanol a 5 % d' acide sulfurique en 1' absence d'oxygene. Les 
derives dimethyles et trimethyles de I'uro'gen III sont ensuite 
separes par chromatographie sur couche mince de silice en utilisant le 
dichloromethane/methanol (98,3/1,7) comme systeme eluant (F. Blanche 
25 et 1989). L'activite de la SP 2 MT est exprimee par le rapport de 

la quantite de derives trimethyles obtenus sur 1' ensemble des derives 
(di- et tri-) methyles produits ramenee, a la quantite de proteine. 
L^ extrait de SC510 Rif^ pXLISOO introduit dans le test ne presente pas 
d' activite SP 2 MT detectable dans les conditions de dosage (le ratio 
30 precorrine-3 produits sur precorrine*2 produits durant le test est 

inferieur a 0,05). 

b) Purification de la S“adenosyl-L-methionine:precorrine-2 methyl- 
transferase de Pseudomonas denitrif icans 

Cette experience il lustre comment une proteine de 
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Pseudomonas deni trificans intervenant dans la voie de biosynthese de 
cobalamines peut etre purifiee lorsgu'un dosage de I'activite en 
question existe. 

La proteine est purifiee a partir de cellules de SC510 
5 Rif‘‘ contenant le plasmicte pXL253- 11 s'agit du plasmide pKT230 sur 
lequel a ete insere le fragment EcoRI de 8,7 kb (figure 13). Dans une 
exp^ience typique de purification, 50 g de cellules humides de la 
souche SCI 50 Rif ‘‘dans laquelle a ete introduit le plasmide pXL253 sent 
suspendues dans 250 ml de phosphate de potassium 0,1M pH 7,7, 5 mM DTT 
10 et soniquees durant 15 minutes 4 4*C. Apres centrifugation a 50 000 g 
dvirant 1 heure, le surnageant est pass4 a travers une colonne de 
DEAE— Sephadex (10 ml de gel) pour eliminer les composes 
tetrapyrroliques. Le pH de I'extrait brut ainsi obtenu est ajuste a pH 
7,7 avec KOH 0,1- M. Les proteines precipitant entre 33 % et 45 % de 
15 saturation en sulfate d'ammorilum sont colfectees et dissoutes Hans 40 
ml de Tris-HCl 0,1M pH 7,7, ;5, mM DTT. Cette solution est passes a 
travers une colonne ^e ■ Sephadex G-25 eluee avec du Tris-HCl 1 0 mM pH 
7,7, 5 mM DTT et les prot4ines collectees sont injectees sur une 
colonne de DEAE-TrisSCtyl-^. Les protdihes sont eluees avec un 
20 gradient lineaire de ■ 0 a O', 25 M KCl et les fractions contenant 

I'activite SP 2 MT sont regroupees et paSSees une seconds fois a travers 
une colonne de Sephadex G-25' comme ci-dessus . La fraction proteique 
est injectee sur une colonne d'Ultrogel HA (IBF) equilibree dans le 
Tris-HCl 10 mM pH 7,7, 5 mM DTT. Les proteines ' sont eluees avec un 

25 gradient lineaire de 0 a 50 mM de phosphate de potassim pH 7,8 

contenant 5 mM DTT. Les fract^iis contenaiit I'activite recherchee sont 
regroupees et injectees sur une MonoQ HR 5/5 (Pharmacia) equilibree 
avec du Tris-HCl 50 mM pH 7 , 1 , 5 mM DTT. La SP 2 MT est eluee avec un 
gradient lineaire (0 a 0,25 M) de KCl. A la sortie de I'etape MonoQ, 
30 I'electrophorese en PAGE-SD^ (12,5 %) avec coloration aux sels 

d' argent revele que 1' enzyme est pure a plus de 99 %. Ceci est 

confirme par I'unicite de la! sequence' NH 2 - terminale de la proteine. Le 
poids moleculaire calcule a ‘partir de I'electrophorese en conditions 
denaturantes (PAGE-SDS 4 12,5 %) ' est de 26 500. Les etapes de 
35 purification de la SP 2 MT a^ec leurs rehdements, sont decrites dans le 
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tableau ci-dessous. 

Tableau : Purification de la SP 2 MT 



10 

^ce facteur est calcule d'apres le rendement en proteines. 

c) Sequence NH 2 -tenainale de la SP 2 MT et identification du gene de 
structure codant pour cette activite 

Cet exemple illustre comment la sequence NH 2 -terminale 
15 d'une proteine qui intervient dans la voie de biosynthese permet 
d' identifier le gene de structure qui code pour cette proteine. Dans 
1' exemple present, il s'agit du gene de structure de la SP 2 MT. 

La sequence NH 2 -terminale de la proteine purifiee a ete 
realisee comme decrit precedemment . Les 15 premiers acides amines ont 
20 ete identifies : 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 

Ser Gly Val Gly Val Gly Arg Leu lie Gly Val Gly Thr Gly Pro 

La sequence NH 2 - terminals de la proteine GOBI (figure 16) 
correspond exactement a cette sequence, si ce n'est qua dans la 
23 sequence presentee sur la figure 16 une methionine prec^e la sequence 
peptidique deduite de la sequence nucleotidique. II en results que la 
methionine aminoterminale est certainement excises in vivo par la 
methionine aminopeptidase (Ben Bassat et Bauer, 1987). Le poids 



Etape de 
purification 


Vol 

(ml) 


Proteines 

(mg) 


Facteur de 
purification^ 


Extrait brut 


300 


6000 


- 


Precipitation 


40 


1530 


3;9 


(33-45 %) 






DEAE-Trisacryl-M 


57 


355 


16.9 


Ultrogel HA 


30 


71 


85 


MonoQ HR 5/5 


12 


33.5 


179 
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moleculaire de la SP 2 MT purifiee estime par electrophorese PAGE-SDS a 
12,5 % est de 26 SOOC La proteine GOBI a un’poids moleculaire deduit 
de sa sequence en acides' amines de ;25 878 (figure 16). Les 
correspondances entre les sa^enceTs' "NB 2 *terminales et les poids 
5 moleculaires indiquent clair^m^nt que lA proteine GOBI correspond a la 

^ -v 

SP 2 MT. Le gene cobi est le gme de structure de la SP 2 MT. 

6.1.4. Identification' de la proteine GOBH codee par le 
gme cobH • ' 

a) Dosage de I'activite precprrih-8x mutas'fe. 

10 Get exemple illustr'e le dotage d'linie activite enzymatique de la 
voie de biosynthese des cobalamines qui n'a jusqu'a ce jour jamais ete 
decrite. II s'agit de la pr|dorrin-8x mutase. Gette enzyme catalyse 
le transfert dii groupement ’ methyl ' de la position C-11 a la 
position C— 12 lors de la transformation du precorrin— 8x en acide 
15 hydrogenobyrinique (vdir la' nomenclature des carbones FIG. 19; 

PL. 68). Plus generalementj c' est 1' enzyme catalysant le transfert 
du groupement methyl de C-1 1 vers. C-12',, condui^ant ainsi au noyau 
corrine. L' enzyme est iCi appelte mutase, bien qu'il ne soit pas 

formellement demontre que le transfert’ du groupement methyl soit 
20 intramoleculaire, meme si cel^ est tires yiraissemblable . 

L' activite enzymatiqile est mise en evidence par la 
transformation du precorrin-1§ic (5 jjM) en acide hydrogenobyrinique au 
cours d'incubationsen presence de fractions enzymatiques dans du 
Tris-HGl 0.1 M pk 7.7, 1 mM iDTA, a '30*G duraht 1 h. En fin 

25 d' incubation, la reaction est stqp^e par chauffage a 80 ’C durant 10 

min et apres centrifugatidh a 3000 * gf durant 10 min, I'acide 
hydrogenobyrinique forme Jjresent le sumageant est analyse par CLHP 
(Gf exemple 6. 1.2. a). 

b) Purification de la precorrih-8x mutase. 

30 La purification de la precorrin-8x mutase de Pseudomonas denitrificans 
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est realisee comme decrit ^i-dessous. 

Durant cette purification, toutes les solutions tampons sont 

ajustees a pH 1 . 1 . 

Dans une experience typigue de purification, 50 g de cellules de la 

5 souche SC510 Rifr portant le plasmide pXL253 (plasmide pKT230 sur 

leguel a ete clone, au site EcoRI, le fragment de 8.7 kb, figure 
13), obtenues apres culture en milieu PS4, sont resuspendues dans 200 
ml de tampon phosphate de potassium 0.1 M, et soniguees durant 12 
min. Apres centrifugation a 50 000 x g durant 1 heure, le 

10 sumageant est passe a travers une colonne de D£A£-Sephadex (10 ml de 

gel) pour eliminer les composes tetrapyrroligues. Le pH de la 
solution est immediatement a juste a 7.7 avec une solution 1 M KOH. 
La fraction proteigue precipitant entre 40 et 60% de saturation en 
sulfate d' ammonium est collectee par centrifugation et dissoute dans 
15 50 ml de Tris-HCl 0.1 M. Cet echantillon est ensuite injecte sur 

une colonne d'Ultrogel AcA 54 (IBF, France) (volme de gel 1000 ml), 
et les proteines sont eluees a un debit de 60 ml/h avec du Tris-HCl 
50 mM. Les fractions contenant I'activite sont regroupees et 
injectees sur une colonne de DEAE-Trisacryl M (IBF, France) 
20 eguilibree avec du Tris-HCl 50 mM, et les proteines sont eluees 

avec un gradient de 0 a 0.2 M KCl. Les fractions contenant la 

proteine a purifier sont regroupees, passees a travers une colonne de 
Sephadex G25 eguilibree en Tris-HCl 10 mM. La fraction proteigue est 
injectee sur une colonne d'Ultrogel HA (IBF, France) eguilibree avec 
25 du Tris-HCl 10 mM, et les proteines sont eluees avec un gradient de 0 
a 0.1 M de phosphate de potassium, puis la fraction active est 
chromatographiee sur une colonne de Phenyl -Sepharose CL 4B 
(Pharmacia) dans du phosphate de potassium 10 mM, eluee avec un 
gradient de 0.65 a 0 M de sulfate d'ammoniiun. Les fractions 

30 actives sont regroupees . La proteine ainsi obtenue est pure a 

plus de ’ 95% (d' apres les resultats d'electrophorese PAGE-SDS a 

12.5% et coloration aux sels d' argent). La purete de la proteine est 
confirmee par I'unicite de la sequence N-terminale. Son poids 
raoleculaire calcule a I'aide de cette technique est de 22 000, Les 
etapes de purification de la precorrin-8x mutase avec leurs 



35 
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rendements de purification sent decrites sur le tableau oi-dessous. 
tableau: Purification de la precorrin-6x mutase. 



Etape de 

. p'iTi f 1 rati on 


Vol 

(ml) 


Protdines 

(me) 


Facteur de 
Durificationf 


Extrait brut 


250 


6000 




Precipitation 
(40-60 %) 


50 


2350 


2.6 


Ultrogei ACA 54 


70 


655 


9.2 


DEAE-Trisacryl M 


30 


271 . 


22 


Ultrogei HA 


22 


93 


65 


Phdnyl Sdpharose 


12 


31 


194 



^ce facteur est calcule d'apres le rendement en proteines 

c) Sequence NH 2 -terminale de la precorrin-8x mutase et identification 
de son gene de structure. 

Cet example illustte comment la sequence NH 2 -terminale d'une 
proteine qui intervient dans la voie de biosynthese permet 
d' identifier le gene de structure qui code pour cette proteine. 

La sequence NH 2 -terminale de cette proteine a ete realisee 
comme decrit precedemment . 15 residue ont 4te identifies : 

^ 2 3 4 5 6 7 8 9 10 11 12.13 14 15 

Pro Glu Tyr Asp Tyr He Arg Asp Gly Asn Ala He Tyr Glu Arg 

La sequence NH 2 -terminale de la proteine COBH (figure 16) 
correspond exactement a cette sequence, si ce n'est que dans la 
sequence presentee sur la figure 16 une methionine precede la sequence 
peptidique ddterminee par le: sequengage decrit ci-dessus. H en 
results que la methionine amipoterminale est certainement excises in 
Yivs par la methionine aminopi^tidase (Ben Bassat et Bauer, 1987). Le 
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deuxieme residu etant une proline, cette excision est conforme aux 
regies deja enoncees (Hirel et , 1989). Le poids moleculaire de la 
precorrin*8x nrutase purifiee estime par electrophorese PAGE-SDS a 12,5 
% est de 22 000. La proteine COBH a \m poids moleculaire deduit de sa 
5 sequence de 22 050 (figiire 16). Les correspondances entre les 

sequences NH j-terminales et les poids moleculaires, de ces proteines, 
indiquent clairement que la proteine COBH correspond a la precorrin-8x 
mutase. cobH est. le gene de structure de la precorrin-8x mutase. 

d) Preparation, isolement et identification du precorrin-8x. 

10 Dans une experience typique de preparation du precorrin-8x, un 

extrait enzymatique brut de la souche SC510 Rifr pXL253 (1000 mg 
de proteines) est incube en anaerobiose durant 20 h a 30 ‘'C 
dans 100 ml de tampon Tris-HCl 0.1 M pH 7.7 avec. 1000 nmol de 
trimethylisobacteriochlorin prepare comme deer it precedemment 
15 (Battersby et al., 1982), EDTA (1 mM), ATP (100 ^IIlol), MgC12 (250 

Mmol), NADH (50 m^oI), NADPH (50 m^oD, SAM (50 M^ol) et acide 
hydrogenobyrinique (20 ^nol). En fin d' incubation, le precorrin-8x 
est le produit tetrapyrrolique forme majoritaire. II est isole et 
purifie par CLHP sur une colonne pBondapak Cl 8 (Waters) en utilisant 
20 un gradient d' elution lineaire de 0 a 50% d' acetonitrile dans un 

tampon phosphate de potassium, pH 5,8. La masse du precorrin-8x (m/z = 
880) et la masse de son derive methyl ester (m/z = 978) indiquent 
qu'il s'agit d'un compose ayant la meme formula brute que I'acide 
hydrogenobyrinique. Les caracteristiques UV/Visible et de 
25 fluorescence sont tres differentes de celles de I'acide 

hydrogenobyrinique et indiquent que la molecule . possede deux 
chromophores separes. La seule reaction enzymatique 

d' isomerisation entre precorrin-6x (Thibaut et al, 1990) et I'acide 
hydrogenobyrinique etant la migration du methyl de C- 1 1 vers 
30 C-12, le precorrin-8x est le dernier intermediaire avant I'acide 

hydrogenobyrinique et la reaction correspondante est la migration du 
methyl de C-11 vers C-12, catalysee par la precorrin-8x mutase. 



6.1.5. Identification de la proteine COBU codee par le 
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gene cobu 

a) Dosage de I'activite 

nicotinate-nucleotide : dimethy Ibenzimidazole phosphoribosyltransf erase 
(figure 5, reaction 5). Get ^emple illustre le dosage d'une activite 
5 enzymatigue directement liee a la voie de biosynthese des cobalamines . 
Il s'agit de la nicotinate-nucleotide rdimethylbenzimidazole 
phosphoribosyltransferase (NN:DMBI PRT) (EC 2.4.2.21). Les fractions 
contenant 1' activite NNrDMBI PRT (environ 5 unites) sont incubees a 
30 *C durant 8 on dans 500 pi de tampon glycine :NaOH 0.1 M pH 9.7 en 
10 presence de 1 oM NaMN (acide nicotinique mononuceotide ) et 10 pM DMBI. 
La reaction est ensuite stoppee par chauffage a 80 'C durant 10 on, le 
melange reactionnel est dilue par 4 volumes d'eau et 100 jjI de cette 
solution sont injectes sur une colonne CLHP Nucleosil 5-C8 de 15 cm 
eluee avec un melange 0.1 M phosphate de potassium pH 2.9 racetonitrile 
15 (93:7) a un debit de de 1 ml/min. Le a-ribazole 5 '-phosphate est 

detects et quantifie par fluorimetrie (excitation : 260 nm; emission 
>370 nm) . L'lmite d'activite enzymatique est definie comme la quantite 
d' enzyme necessaire pour generer 1 nmol de a-ribazole 5 '-phosphate par 
heure dans ces conditions. 

20 b) Purification de I'activiteNN: DMBI PRT de Pseudomonas denitrificans 
Cette experience illustre comment une proteine de P. denitrificans 
intervenant dans la voie de bios 3 ^these des cobalamines peut etre 
purifiee. A partir du dosage decrit dans I'exemple 6. 1.5. a), la 
purification de la NM: DMBI PRT de Pseudomonas denitrificans est 
25 realises comme decrit ci-deSsso\is. Dans une experience typique de 

purification on utilise 10 g de cellules humides de la souche SC510 
Aifr dans laquelle le plasmids pXL1490B a ete introduit comme cela est 
decrit precedemment . Le pleismide pXLl490B est decrit sur la figure 38; 
ce plasmids a ete obtenu par clonage du fragment BamHI-Sstl-SstI de 
30 3.85 kb du pXL519 (voir fig^e 38). Ce plasmide porte done les genes 

cobu et cobV de P. denitrificans. Les cellules cultivees en milieu 
PS4, supplements en lividomygihe, comme cela est decrit precedemment, 
sont recoltees apres 96 heures de culture en milieu PS4. Elies sont 
resuspendues dans 25 ml de tampon 0.1M Tris-HCl pH 7.2 et soniquees 
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durant 15 nn a 4*C. L' extrait brut est ensuite recupere par 
centrifugation durant 1 h a 50 000 g puis passe a travers une colonne 
de DEA£-Trisacryl M (IBF, France) eguilibree avec le meme tampon. 10 % 
de I'eluat (120 mg de protiines) est fractioime sur tine colonne de 

3 Hon-o Q HR 10/10 en utilisant un gradient de KCl (de 0 a 0.6 M) . Les 

fractions actives sont regroupees et concentrees a 2 ml par 

ultrafiltration puis apres melange avec un volume de tampon Tris-HCl 
30 mM pH 7.2, I'echantillon est fractioime tme seconde fois sur une 
Mono Q HR 5/5 comme precedemment . Les fractions actives sont 
10 regroupees puis I'echantillon est amene a tme molarite de 1 M a 

I'aide de sulfate d' ammonium et chromatographie sur une colonne de 
Ph^yl-Superose HR 5/5 elue avec un gradient decroissant de sulfate 
d' ammonium (de 1 M a 0 M) . Les fractions nontenant I'activite 
recherchSe' sont rassemblees, concentrees par ultrafiltration, et 
15 chromatographiees sur une colonne de permeation de gel Bio-Sil 250, 
eluee avec du phosphate de sodium 20 mH-sulfate de sodium 50 mM pH 
6 . 8 . 

Apres cette etape, 1' enzyme est pure a plus de 95 %. Bile ne presente 
aucune proteine contaminante en FAGE-SDS. Cette purete est confirmee 
20 par I'unicite de la sequence NH2-terminale. Son poids moleculaire dans 
cette technique est de 35 000. Les differentes etapes de purification 
de la NN:DMBI PRT sont portees sur le tableau ci-dessous. 



Tableau : Purification de la nN:DMBI prt de P. denitrificans 
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Etape de 
purification . 


vol 

(ml) 


Protdinjes 
■ (mg) 


Actjvite spe, 
(u/mg de 
proteines) 


Rendement 


Facteur de 
purification^ 


Extrait brut 


6,0 


120 


2650 


- ^ 


• 


MonoQ 10/10 


6,0 


12,07 


13515 , 


51,3 


5.1 


MonoQ 5/5 


3,0 


6,19' 


• 20140 


39,2 


7.6 


Ph6nyl - Superose 


1.5 


2,60 .. 


3SS10 


29,0 


13,4 


Bio-Sil 250 


1-2 

1 


1,92 


^ 39750: 


24,0 


15.0 



c) Sequence NH2-terminale de la JWtDMBI ,PRT de P, denitrif icans et 
10 identification du gene de structure de Pseudomonas denitrif icans 

codant pour cette actiyite* La sequence NH2-terminale de la NN:DMBI 
PRT de Pseudomonas denitrif icans purifdee comme decrit dans 1' example 
6.1,5b) a ete realisee selon la technique decrite ci-dessus, Les 15 
premiers residus ont ete identifies : 

15 1 2 3 4 5 6 7 8 9 1 0 1 1 12 1 3 1 4 1 5 

Ser Ala Ser Gly Leu Pro Phe Asp Asp Phe Arg Glu Leu LeuArg 

La sequence NH2-terrainale de la proteine COBU (figure 41) correspond a 
cette sequence, si ce n'e^ que dans la sequence presentee sur la 

fig\xre 41, une methionine jprecede le premier acide amine de la 
20 sequence peptidigue determinee par sequenqage direct. II en resulte 
gue la methionine aminoterminale est certainement excisee in vivo par 
la methionine aminopepti(^se (Ben Bassat let Bauer, 1987). Le poids 
rooleculaire de la N-trans^lycpsidase piirifiee estime par 
electrophorese PAGE-SDS a 12,5 % est de 35 000. La proteine COBU a un 

i," Ij.. 

23 poids moleculaire deduit de' Sa sequence de 34 642 (figure 41). Les 
correspondances entre les :;,seguences NH2-terminales et les poids 
moleculaires indiguent clair^ent gue la proteine COBU correspond a la 
NNiDMBi PRT. Le gene cobU est le gene de structure de la NN:DMBI PRT. 
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d)Specificite de la NN:DBI PET pour de DBI. Get example illustre 
conunent 1' etude de la specif id te de la NN:DMBI PET de P. 

denitrificans permet de faire biosynthetiser a P^ denitrif icans 
diverses cobamides en utilisant les proprietes catalytigues de la 

5 NNrDMBI PET de P. denitrificans pour effectuer la synthese de la base 
nucleotidigue en question. 

Le substrat de 1' enzyme pour synthetiser des cobalamines est le 

5, 6-dimethylbenzimidazole. Le benzimidazole et le 

5-methylbenzimidazole, respectivement, sont des substrats de la 
10 reaction avec des vitesses de reaction de 157 % et de 92 %, 

respectivement, compare au substrat natural 

(5,6-dimethylbenzimidazole) r la concentration en NaMN etant fixee a 2 
mM. La specif icite de la NN:DMBI PET de P. denitrificans est done 
faible pour les substrats a noyau benzimidazole. On peut done utiliser 
15 la souche de P. denitrificans SC510 Eifr (Cameron et al., 1989), la 

cultiver en milieu PS4 ou le 5, 6-dimethylbenzimidazole est remplage 
par du benzimidazole ou du 5-dimethylbenzimidazole, respect ivement, 
afin de faire synthetiser a la bacteria de la 
Coa- ( benzimidazoly 1 ) -Co p-cyanocobamide , 

20 Coa- ( 5-methylbenzimidazolyl ) -Cop-cyanocobamide respectivement . II est 

certain que d'autres cobamides pourraient etre synthetisees de cette 
maniere . 

6.1.6. Identification de la proteine COBV codee par le 

gme CobV. 

23 Cet example illustre comment le dosage d'une actlvite de 

la voie de biosynthese du coenzyme B12 chez P. denitrificans, puis la 
purification partielle de cette activite peut permettre d' identifier 
le gene de structure de cette enzyme chez P. denitrificans. 
a ) dosage de 1 ' activite GDP-cobinamide : a-ribazole ( 5 ' -phosphate ) 
30 cobinamidephosphotransf erase (pu cobalamine (5' -phosphate) synthase) 
Cet example illustre le dosage d'une activite directement liee a la 
voie de biosynthese des cobalamines. II s/agit de la cobalamine 
(5 '-phosphate) synthase. Les fractions contenant 1' activite (environ 5 
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a 10 unites) sont incubees a' 1' obscurity a 30 ‘C dans 500 pi de tampon 
Tris-HCl 0.3 M pH 9.0 en preBtince de 1 mH EOTA, 12.5 mM MgC12, 50 pM 
a-ribazole 5 '-phosphate et/ 20 pM GDP-cobihamide [sous forme 
5'-deoxy-5'-adenosyl (Ado) bd%benzyme}. Apres 15 mn d' incubation, 500 
5 pi de cyaniire de pdtassium '20 mM sdnt ajoutes et la solution est 
chauffee a 80 *C duTctnt TO mn. Apres centrifugation pour eliminer le 
materiel precipite, la vitamine B1 2 5' -phosphate presente dans le 
sumageant est dosee comma cela est decrit a 1' example 9. Une unite de 
cobalamine (5'-phosphate) synthase est definie ^comme la quantite 
10 d' enzyme necessaire pour generer 1 nmol de cobalamine 5 '-phosphate par 
h dans les conditionB^decrites ci-dessus. 

Ii'Ado-GDP-cobinamide est obtenu par incubation de 

I'Ado-cobinamide phosphate (Blanche et al., 1989) avec un extrait de 
SC510 Rifr pXL623'dahs les conditions du ‘ dosa'ge de la cobinamide 
15 phosphate guanylyltransf erase ■ (voir 6.1 . 1 1 .b) ; Le oi-ribazole et le 
a-ribazole-5' -phosphate sont isoles a paftir de cultures de SC510 
Rifr et purifies par CLHP dans les conditions du dosage decrit dans 
I'exemple 6.1.5a). 

b) Purification partiellO de,;ia cobalamine (5' -phosphate) synthase. 
20 Cette experience illustre comment une activite enzymatigue de P. 

denitrif icans intervenant dans;! la vole de^biosynthese des cobalamines 
de P. denitrif icahs peut etre partiellement purifies. A partir du 
dosage decrit ci-dessus, la purification de la cobalamine 
(5' -phosphate) synthase est realises. .Pour ce fairs, dans une 
25 experience typique de purification, 10 ^ dft cellules humides de .la 
souche SC510 Rift dans laquelle le plasmide pXL1490B a ete introduit 
comme cela est decrit precedekment . Le plasmide pXLl490B est decrit 
siir la figure 38; ce plasmide correspond au fragment Sstl-Sstl-BamHI 
de 3.85 kb clone dans le pKT230. Ce plasmide porte les geries cobU et 
30 cobV de P. denitrif leans. La presence de ce plasmide chez P. 

denitrif icans SC510 Rifr conduit a une amplification de 1' activite 
cobalamine (5' -phosphate) synthase d'un f^cteur 100 environ; il est 
done probable gue I'' insert porte par le plasmide pXL1490B contient le 
gene de structure de bette enzyme; ce- gene ne peut done etre que cobU 
35 ou cobV. Les cellules SC510 Rifr pXLl4'90B sont obtenues par culture en 
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milieu PS4 supplemente avec de la lividomycine comme cela est decrit 
ci-dessus. Les cellules sent centrifugees puis resuspendues dans 25 ml 
de tampon Tris-HCl 0.1 M (pH 8.3)-1 mM EDTA (tampon A) et soniques 
pendant 15 mn a 4*C. L' extrait brut est ensuite recupere par 
5 centrifugation 1 h a 50 000 g et passe a travers une colonne de 

Sephadex G-25 equilibree avec du tampon A. La fraction proteique est 
recuperee et injectee par fraction de 300 pi (7.5 mg de proteines) sur 
une colonne de Superose 12 HR 10/30 eluee dans du tampon A. La 
fraction exclue est recuperee, melangee a un volume egal de tampon 
10 A- 1.0 M sulfate *d' ammonium et chromatographiee sur une colonne de 

Phenyl-Superose HR 5/5. Les proteines sont eluees avec \m gradient 
decroissant de sulfate d' ammonium (de 0.5 M a 0 M) dans du tampon A, 
suivi d'un plateau a 0 M de sulfate d' ammonium dans le but d'eluer 
I'activite cobalamine (5' -phosphate) synthase. La purification 
15 partielle de cette enzyme est decrite dans le tableau ci-dessous, sur 
la base de 75 mg de proteines introduits au depart dans le processus 
de purification. 

Tableau : Purification partielle de la cobalamine { 5 ' -phosphate ) 

synthase de P. denitrificans. 

20 



25 



c) Specif icite de la cobalamine (5'*phosphate) synthase. Le Km pour le 
(Ado)GDP-cobinamide est de 0.9 Toutefois, 1' enzyme presente la 
meme affinite et une vitesse de reaction pratiquement identiques pour 
la forme (CN, aq) du substrat. Le Km de 1' enzyme pour le. a-ribazole 



Etape de 
purification 


vol 

(ml) 


Proteines 

(mg) 


‘AuLiviLe 
(u/mg de 
proteines) 


Rendement 


Facteut' de 
purification^ 


Extrait brut 


3.0 


75 


325 


- 




Superose 12HR 


50.0 


2.9 


6 810 


81 


21 


Phenyl - Superose 


: 4.5 


0.35 


17 850 


26 


55 
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5 '-phosphate est de 2,7 pM environ. De plus, les preparations les plus 
pures de cobalamine (5'-pho^hate) synthaSe catalysent la reaction du 
Ado-GDP-cobinamide avec le o-ribazole pour donner le coenzyme B12 et 
dans ces conditions aucune accumulation de cobalamine 5' -phosphate 
5 n'est observee. Le Km de 1' enzyme pour le a-ribazole est de 7.8 jjM. 
Des concentrations intracellblaires 'en a-ribazole 5' -phosphate et en 
a-ribazole de 30 et de 700 |JI respectiyement , ont ete mesurees par 
CLHP au cours de la production de cobalamines de SC510 Ri£r en milieu 
PS4 dans les conditions de cultures decrites dans 1' example 6.1.5a), 
10 Ceci montre que le coenzj^e B12 peut etre genere directement a partir 
du Ado-GDP-cobinamide par la cobalamine (5' -phosphate) synthase sans 
1 ' intervention d'lane cobalamine 5 ' -phosphatase . 

L' absence d' accumulation ou. la presence de traces de cobalamine 
5' -phosphate dans les cultures de P. denitrificans SC510 Rifr 
confirme que le coenzyme B12 est produit par la reaction directe du 
Ado-GDP-cobinamide avec le a-ribazole in vivo. 

Cette reaction directe a deja ete observee et decrite in vitro chez 
Propionibacterium shermanii (Ronzio et al., 1967; Renz, 1968). Comma 
le gene de structure de la cobalamine (5' -phosphate) synthase ne peut 
20 etre que cobU ou cobV puisque 1' amplification chez P. denitrificans 
d'un fragment portant ces deux genes cob de P. denitrificans conduit a 
une augmentation par un facteiir 100 de I'activite cobalamine 
(5' -phosphate) synthase et que le gene cbbu est le gene de structure 
de la NN:DMBI PRT, cobV est done le gene de structure de la cobalamine 
25 (5' -phosphate) synthase. 

6.1.7. Identification de la proteine COBK codee par le 

gene cobK. 

a) dosage de I'activite precorrin-6x reductase. 

Cet example illustre le dosage d'une activite enzymatique nouvelle 
30 directement liee a la voie de biosynthese des cobalamines. Il 
s'agit de la precorrin-6x reductase. 
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Les fractions contenant I'activite precorrin-6x reductase (environ 
0.05 mites, U) sont incubees a 30 *C durant 60 min dans 250 pi de 
tampon Tris-HCl 0.1 M pH 7.7 en presence de 1 mM EDTA, 500 pM 

NADPH, 25 pM [ methvl -3HlSAM (80 pCi/pmol), 4 pM precorrin-6x (Thibaut 
5 et al., 1990), et 0.5 U de dihydroprecorrin-6x methylase 
partiellement purifiee (voir preparation gi-dessous) . La reaction est 
ensuite stoppee par chauffage a 80 *C durant 5 min et, apres 
centrifugation a 5000 x g durant 5 min, le surnageant est injecte sur 
ime colonne de .DEAE-Sephadex (contenant 200 pi de gel). La colonne 
iO est ensuite lavee extensivement avec le tampon Tris-HCl, et les 
composes fixes sont elues avec 4 ml de 1 M HCl. La radioactivite 
dans cet eluat est coroptee en scintillation liquids. L' unite d'activite 
enzymatique est definie comme la quantite d' enzyme necessaire pour 
reduire 1 nmol de precorrin-6x par h dans ces conditions. 

15 La dihydroprecorrin-6x methylase est partiellement purifiee a 
partir d'un extrait brut de SC510 Rifr pXL253, sur une colonne 
d'echange d' anions Mono Q HR 5/5 (Pharmacia). La colonne est eluee 
avec un gradient lineaire de 0 a 0 . 4 M de KCl dans du tampon 0.1 M 
Tris-HCl pH 7.7. L'activite enzymatique est eluee a 0.35 M KCl. Cette 
20 activite est detectee et quantifiee grace au test d'activite de la 
precorrin-6x reductase defini gi-dessus (en presence de 0.5 U de 
precorrin-6x reductase dans le milieu d' incubation) . Apres I'etape 
de Mono Q, les fractions contenant de activite 
dihydroprecorrin-6x methylase sont totalement depour vues 

25 d' activite precorrin-6x reductase. L' unite d' activite methylase est 
definie comme la quantite d' enzyme necessaire pour transferer 1 
nmol de groupements methyls sur le dihydroprecorrin-6x par h dans 
les conditions decrites gi-dessus. 



b) purification de 1' activite precorrin-6x reductase. 

30 A partir du dosage decrit ci-dessus, la purification de la precorrin-6x 
reductase de Pseudomonas denitrificans est realises comme decrit 
gi-dessous. 

Dans une experience typique de purification, 100 g de cellules humides 
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de la souche SC510 Rifr dans laguelle on a introduit le plasmide 
pXL253 (plasmide pKT230 sur .lequel a ete clone, au site EcoRI, le 
fragment de 8.7 kb, figure 13) sont suspendues dans 200 ml de 
tampon Tris-HCl 0.1 M pH mM EDTA (tampon A), et soniquees 

5 durant 15 min a -4‘C. L'ektrait brut est ensuite recupere par 
centrifugation durant 1 h a 50 000 x g et passe en trois fois a 
travers tine colonne de Sephadex G 25 eguilibree avec le tampon A, Les 
trois fractions exclues du gel sont poolees et ajustees all avec le 
tampon A. Les proteines precipitant entre 25 et 40% de saturation 
10 en sulfate d' ammonium sont collectees par centrifugation et 

resuspendues dans 50 ml de tampon A et cette solution est desalee a 
travers une colonne de Sephadex G 25 eguilibree avec du 
tampon B (25 mM Tris-HCl-500 pM DTT-15% glycerol). La solution de 
proteines est ensuite injectee a 2.5 ml/min sur une colonne de Q 
15 Sepharose Fast Flow (Pharmacia) eguilibree avec du tampon B, et les 
proteines sont eluees avec un melange tampon B-0.2 M KCL. Cette 
fraction est desalee sur une colonne de Sephadex G 25 equilibre avec 
du tampon C (50 mM Tris-HCl-500 DTT-15% glycerol). La solution 
proteique est ensuite fractionnee (100 mg de proteines a chague 
20 chromatographie) sur une cplonne Mono Q HR 10/10 (Pharmacia) a 
I'aide d'un gradient de 0 a 0.4 M KCL dans le tampon C, puis la 
fraction nontenant I'activite- est chromatographiee sur une colonne 
Phenyl-Superose HR 10/10 (Pharmacia) dans un gradient lineaire 
decroissant de sulfate d' ammonium (de 1 a 0 M) . La fraction active est 
25 desalee et la precorrin-6x reductase" est repurifiee sur une colonne 
Mono Q HR 5/5. Elle est eluee dans ie tampon 50 mM Tris-HCl pH 
8.1-500 DTT-15% glycerol, avec gradient de 0 a 0.2 M de KCL. 

Pour parfaire la purification, la proteins est finalement 
chromatographiee sur une colonne Bio-Sil 250 (Bio-Rad) eluee avec 
30 20 mM potassium phosphate-50 mM sodium sulfate, pH 6.8-500 pM 
DTT-15 % glycerol. Apres cette etape, 1' enzyme est pure a plus de 
95%. Elle ne presente aucune , proteine contaminante en PAGE-SDS, les 
proteines etant revelees au nitrate d'arg^t. Ce degre de purete est 
confirms par I'unicite de la sequence NH2-terminale. Son poids 
35 moleculaire dans cette technique est de 31 000. Les differentes stapes 




wo 91/11518 



PCT/FR91/00054 



84 

de purification de la precorrin-6x reductase, avec leur facteur de 
purification et Xexxr rendexnent sont portees sur le tableau gi-dessous. 



Tableau: Purification de la precorrin-6x reductase. 



ELape de 
purification 


- vol 

(ml) 


Pro twines* 
(mg) 


.Ac.t.ivitl.spo^ 
(u/mg de 

proteines) 


Rendement 


Facteur de 
purification^ 


Extrait brut 


270 


9600 


0.535 


• 




S.A. 25 40% 


100 


4160 


1.14 


92 


2.1 


Q Sepharose 


150 


1044 


3.64 


74 


6.8 


Mono Q 10/10 


55 


67 


24.5 


32 


46 


Phenyl -superos€ 


10 


2.2 


325 


= 14 


607 


Mono Q 5/5 


2.5 


0.082 


5750 


^ 9.2 


10750 


Bio-sil 250 


1.0 


0.055 


7650 


8.2 


14300 



c) Sequence NH2-terminale et sequences partielles internes de 
la precorrin-6x reductase de Pseudomonas deni tr if leans et 
identification du g^e de structure de Pseudomonas denitrificans codant 
pour cette activite. 

20 La sequence NH2-terminale de la precorrin-6x reductase de 
Pseudomonas denitrificans purifiee comme decrit ci dessus a ete 
determines comme decrit precedemment . Six residus ont ete identifies: 

Ala-Gly-Ser-Leu--Phe-Asp 

De meme, apres digestion trypsique et separation des fragment CLHP sur 
25 une colonne de phase inverse C-18, trois sequences internes ont ete 
obtenues: . 



Ile-Gly-Gly-Phe-Gly-Gly-Ala-Asp-Gly-Leu 
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Arg-Pro-Glu-Trp-Val-Pro-Leu-Pro-Gly-Asp-Arg 

Val-Phe-Leu-Ala-Ile-Gly 

La sequence NH2«terminale de la proteine COBK (figure 16) 
correspond exactement a la seqxience NH2-tenninale de la precorrin-6x 
5 reductase, si ce n'est que dans la sequence presentee sur la figure 
16, une methionine precede fa sequence peptidique. determines par 
sequenqage direct. II en results que la methionine amdnoterminale est 
certainement excises in vivo par la methionine aminopeptidase (Ben 
Bassat et Bauer, 1987). D§; meme, l.es trois sequences internes 

10 correspondent aux troissequences 60 a 69, 112 a 122, et 143 a 148 

de la proteine COBK, Le poids moleculaire de la precorrin-6x 

reductase purifiee est estimfe par electrophorese PAGE-SDS a 31 OOO. 
La proteine COBK a un poids moleculaire deduit de sa sequence de 28 
000 (figure 16) i Les correspoijdances entre les sequences 
15 NH2-terminales, internes, et les poids moleculaires indiquent 
clairement que la proteine COBK correspond a la precorrin-6x 

reductase. Le g&ie cobK est le gene de structure de la precorrin-6x 
reductase. 

d) Reaction catalyses par la precorrin-6x reductase. 

20 La reaction enzymatique de reduction du precorrin-6x est 
NADPH-dependante de fagon stricte chez P. denitrificans. Le NADPH ne 
peut pas etre remplage par le NADH. Lqrsqae 1' enzyme purifiee (ou une 
fraction active en cours de purification, ou meme un extrait 
enzymatique brut) est incubee dans. le$ conditions du dosage de 

25 I'activite , mais en 1' absence de SAM et de dihydroprecorrin-6x 

methylase, le produit de la reaction peut alors etre purifie par CLHP 
dans le systems decrit pour la purification du precorrin-6x (Cf example 
6. 1 . 4 ,d) . Apres desalage et esterification (methanol sulf urique a 
4%, 20 *C, 24h, atmosph^e argon),. 1' ester correspondent a une 

30 masse m/z = 1008> . Le produit de la reaction catalyses par la 

precorrin-6x reductase est done le dihydroprecorrin-6x, appele aussi 
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precorrin-6y. 

6.1.8. Identification de la proteine COBQ codee par le gene 

CobQ. 

a) Dosage de I'activite cobyric acid synthase. 

5 Get exemple illustre le dosage d'une activite enzymatique de la voie 
de biosynthese des cobalamines qui n'a jusqu'a ce jour jamais ete 
decrite. 11 s'agit de la cobyric acid synthase. Cette enzyme catalyse 
I'amidatlon des fonctions acides carboxyliques peripheriques en 
positions b, d, e, et g sur le noyau corrine (voir FIG. 19; PL. 68). Le 
10 donneur de groupements NH2 est la L-glutamine et cheque reaction 
d'amidation s'accompagne de la consommation d'une molecule d'ATP. 

La fraction a doser est incubee a I'obscurite a 30 *C pendant 60 min 
dans 250 pi de tampon 0.1 M Tris hydrochloride pH 7.5 contenant 1 
mM DTT, 1 mM EDTA, 1 mM ATP, 2.5 mM MgC12, 1 mM glutamine, 10 pM 
15 acide Ado-cobyrinique di- ou pentaamide. La reaction est stoppee en 
ajoutant 25 pi d'une solution aqueuse 0.1 M de cyanure de potassium. 
Apres chauffage a 80 *C durant 10 min et centrifugation a 3000 x g 
durant 1 0 min, les composes formes presents dans le surnageant sont 

analyses par CLHP. L'linite d'activite est definie comme la quantite 
20 d' enzyme necessaire pour generer 1 nmol de fonctions amides par h dans 
ces conditions . 

Les acides 5'-deoxy-5'-adenosyl{Ado)-cobyriniques diamide et 
pentaamide sont isoles de cultures de la souche SC510 en milieu PS4, 
en utilisant la methods dont le principe est decrit dans 1' exemple 9. 

25 b) Purification de la cobyric acid synthase. 

A partir du dosage decrit a 1' exemple 6.1.8 a), la purification de la 
cobyric acid synthase de Pseudomonas denitrificans est realises 
comme d4crit gi>dessous. 

Dans une experience typique de purification, 6 g de cellules humides 
30 de SC510 Rifr dans laquelle on a introduit le plasmide pXL618 (voir 
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exemple 4.5.2) sont soniques dans 15 ml de tampon Tris-HCl 0.1 M 
pH 7.7, DTT 1 mM, . EDTA 1#I./ . Apr^ centrifugation (50 000 x g 

durant 1 h), 1' extrait est amene a 20% de glycerol (vol/vol). A 8.5 

ml de I'extrait brut (203.5 ing de proteines) sont ajoutes 24 ml de 

5 tampon Tris-HCl 10 mM, DTT 1 mM, glycerol 20%. La solution est injectee 
sur Mono Q HR 10/10 (Pharmacia) a 2 ml/min eguilibree avec du tampon 

Tris-HCl 50 mM pH 7.7, DTT 1 mM, glyc^ol 20%. Les proteines sont 

eluees avec un gradient lineaire de 0.5 M NaCl et les fractions 
actives regroupees et amenesi a 1 mM EDT^. La solution est amenee 
10 a 0.85 M en sulfate d' ammonium et injectee sur une colonne 

Phenyl-Superose HR 5/5 (Pharmacia), eguilibree dans le tampon Tris-HCl 
pH 7.7, DTT 1 mM, Sulfate d' ammonium 0.85 M et les proteines sont 

eluees avec un gradient lineaire decroissant de 0.85 M a 0 M de 
sulfate d' ammonium. Les fractions sont immediatement amenees a 20% de 
15 glycerol. La fractionactive eSt concentre a 2.5 ml par ultrafiltration 
et chromatographiee sur une •’ colonne PD 10 (Pharmacia) eguilibree et 
iluee avec du tampon Tris-HCl *:50 mM pH 8.3, DTT 1 mM, glycerol 20% 
(vol/vol). La fraction proteigue est recueillie et injectee sur une 
Mono Q HR 5/5 eguilibree avec le meme tampon et les proteines 
20 sont 4luees avec un gradient lineaire de 0.5 M NaCl. La 

chromatographie de permeation sur gel Bio-Sil 250 (Bio-Rad) en 
milieu tampon Tris-HCl 50 mM pH 7.5, ’ DTT 1 mM, glycerol 20%, NaCl 

0.1 M permet finalement d'obtenir une proteine pure a plus de 97%. 

Elle ne presente aucune proteine cbiitaminante en PAGE-SDS. Cette 
25 purete est confirmee par I'unicite de la siguence NH2-terminale . Son 
poids moleculaire dans Cette techniigue est de 57 000. Les 

dif ferentes etapes de purification de la cobyric acid synthase avec 
leur facteur de purificatioiii et ' leur rendeihent sont portees sur le 
tableau gi-dessous. 

30 Tableau: Pxarification de la cobyric acid synthase. 
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Etape de 
purification 


vol 

(ml) 


Proteines 

(mg) 


Activite spe. 

U /mg 
a b 

A B 


a 

Rendement 


Facteur de 
purification^ 


Extrait brut 


8.5 


203 


114 / 118 


- 


- 


MonoQ 10/10 


8.0 


35.5 


388 / 425 


60 


3.4 


Ph6ny 1 • super o s e 


8.0 


3.23 


1988 / 2021 


28 


17 


MonoQ 5/5 


1.0 


1.20 


4549 / 4085 


24 


40 


Bio-Sil 250 


0.75 


0.88 


4992 / N.D. 


19 


44 



10 a/ Avec I'acide Ado-cobyrinique a,c-diamide coinme substrat 
b/ Avec I'acide Ado-cobyrinique pentaamide comrae substrat 
ND = Non Determine 

Le tres haut degre de purete de la proteine purifiee ainsi que la 
Constance du ratio des activites d'amidation des acides 

15 cobyriniques diamide et pentaamide tout au long du precede de 
purification de la proteine (voir tableau gi-dessus) indiquent sans 
ambiguite qu'une seule et meme proteine est responsable des quatre 
activites d'amidation du noyau corrine aux positions b^ d, e, et g. 

c) Sequence NH2-terminale de la cobyric acid synthase de 

20 Pseudomonas denitrificans et identification du gene de structure 
de Pseudomonas denitrificans codant pour cette activite. 

La sequence NH2-terminale de la cobyric acid synthase de 

Pseudomonas denitrificans a ete determines comme decrit precedemment . 
Seize residue ont ete identifies: 

25 Thr-Arg-Arg-Ile-Met-Leu-Gln-Gly-Thr-Gly-Ser-Asp-Val-Gly-Lys-Ser 

La sequence NH2-terminale de la proteine COBQ (figure 47} 
correspond exactement a cette sequence, si ce n'est que dans la sequence 
presentee sur la figure 47, une methionine precede la sequence 
peptidique determinee par sequengage direct. II en resulte que la 
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methionine aminoterminale est certainement excisee in vivo par la 
methionine aminopeptidase (B©i Bassat et Bauer, 1987). Le poids 
moleculaire de la cobyric acid synthase purifiee est estime par 

electrophorese PAGE-SDS a 57 000. La proteine COBQ a un poids 
5 moleculaire deduit de sa sequence de : 52 000 (figure 47). Les 

correspondences entre les sequences NH2-terminales et les 

? 

poids moleculaires indiguent clairement que la proteine COBQ 
correspond a la cobyric acid synthase. Le gene cobQ .est le gene de 
structure de la cobyric acid synthase. 

6.1.9. Identification de la proteine COBO codee par le g^e 

cobO. 

a) dosage de I'activite cob(I)alamin adenosyltransferase (EC 2.5.1.17). 

Cet exemple illustre le dosage d'une activite enzymatique directement 
liee a la voie de biosynthese des cobalamines. 11 s'agit de la 
15 cob(l)alamin adenosyltransferase (EG 2.5.1.17). Cette enzyme a ete mise 
en evidence dans les cellules bacteriennes (Ohta et al., 1976, 
Brady et al., 1962) et animates (Fenton et al. 1978). Elle a ete 
purifie a partir de Clostridium tetanomorphum (Vitols et al., 1966). 
Les fractions contenant I'activite cob(I)alamin 

20 adenosyltransferase (environ 20 \inites) sont incubees de fagon 
anaerobie a 30 *C dwant 15 min I'abri de , la lumiere dans 1 ml de 
tampon Tris/HCl 0.2 M pH S.Q.en presence de 5 mM DTT, 400 pM [8-14C] 
ATP (2.5 pCi/pmol) , 800 |.M MnC12, 50 pM hydroxocobal amine ou, 

diaquacobinamide et 3 mg KBH4 . La reaction est ensuite stoppee par 
25 chauffage a 80 *C durant 10 min et, apres centrifugation a 15000 x g 
durant 5 min, 200 pi de surnageant sont analyses par CLHP (Girasing 
et al., 1986, Jacobsen et al., 1986). 

L'xjnite d' activite enzymati^e est definie comme la .quantite 

d' enzyme necessaire pour generer 1 nmol d'adenosylcorrinoide par 
30 min dans ces conditions. 

b) Purification de I'activite cpb(I)alamin adenosyltransferase. 
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A partir du dosage decrit a I'exemple 6.1.9 a), la purification de 
la cob(I)alamin adenosyl transferase de Pseudomonas denitrificans est 
realisee comme decrit gi-dessous. 

Dans \ane experience typigue de purification, 10 g de cellules humides de 
5 la souche SC510 Rifr dans laquelle le gene cobO a ete amplifie sont 
suspendues dans 20 ml de tampon Tris-HCl 0.2 M pH 8.0 et soniquees 
durant 40 min a 4®C. L' extrait brut est ensuite recup&re par 
centrifugation durant 1 h a 50 000 x g et dessale sur colonnes PD10 
(Pharmacia) eguilibrees avec du tampon 50 mM Tris-HCl pH 8.0, 5 raM 
10 DTT (tampon A). La solution proteique est ensuite fractionnee (280 mg 
de proteines a chaque chroraatographie) sur une colonne Mono Q HR 
10/10 (Pharmacia) a I'aide d'xin gradient de 0 a 0.5 M KCL dans le 
tampon A, puis les fractions contenant I'activite sont poolees, 
concentrees par ultrafiltration et chromatographiees sur une colonne 
15 de Phenyl-Superose HR 10/10 (Pharmacia) dans un gradient lineaire 
decroissant de sulfate d' ammonium (de 1,7 a 0 M), la colonne etant 
equilibree dans le tampon 0.1 M Tris--HCl pH 8.0, 5 mM DTT, Pour 

parfaire la purification, la proteine est finalement chromatographiee, 
apres concentration par ultrafiltration, sur une colonne Bio-Sil 250 
20 (Bio-Rad) eluee avec le tampon 50 mM Tris-HCl pH 7.5, 0.1 M NaCl, 5 mM 
DTT. 

Apres cette etape, 1' enzyme est pure a plus de 95%. Elle ne presente 
aucune proteine contaminants en PAGE-SDS . Son poids moleculaire 
dans cette technique est de 28 000. Ce degre de purete est confirme 
25 par I'unicite de la sequence NH2-terminale. Les differentes etapes 
de purification de la cob(I)alamin adenosyl transferase, avec leur 
facteur de purification et le\ar rendement sont portees sur le tableau 
^i-(jessous pour les deux substrats suivants: diaquacobinamide (a) et 

hydroxocobalamine (b) . Ces resultats demontrent 1' absence de 

30 specif icite de cette enzyme pour la nature du substrat corrinoide. 
D' autre part, tous les corrinoides de la voie de biosyn these entre 
I'acide cobyrinique diamide et la B12 ont ete isoles (Blanche et 
al., resultats non p\iblies) sous leur forme native, et se sont reveles 
etre sous forme coenzyme. Ceci demontre que le sxibstrat naturel 
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de la cob(X)alamin adeno^ltransf erase est I'acide cobyrinique 
a,-c-diamide. 



Tableau: Purification devla cobGDalamin adenosyltransferase . 

■ ' /■' , . 



5 


Etape de 
purification 


vp.l > 
(ml) 


Prot4inee’ 

(mg) 


Activity sp6. 

■ U'/og"v'. 

a -h; 

A B ' 


a 

Rendement 


Facteur de 
purification^ 




c 












10 


Extra! t brut 
MonoQ 10/10 


100 

90 


1400 
‘ 140 


5.4 / 3.4 

34 C 9 / 14.1 


65 


6.5 




Phenyl- Super ose 


30 




84.5 / 49.5 


18 


16 




Bio-Sil 250 


6.5 


2.9 


182.4/ 88.7 


7.0 


34 



c/ apres dessalage sur PD10 



c) Sequence NH2-t^ininale de la cptCDalamin adenosyltransferase 

15 de Pseudomonas deni tr if leans et identification du g&ie de 

structure de Pseudomonas deni tr if leans codant pour cette activite. 

La sequence NH2~terminale de la cob(I)alarain adenosyltransferase 

de Pseudomonas deni trif leans purifiee comme decrit a 1' example 6.1,9 b) 
a ete determinee, conune decrit precedenunent . 13 residus ont ete 
20 identifies: 

Ser-Asp-Glu-Thr-?-VaI-Gly-Gly^Glu-Ala-Pro-Ala-Lys-Lys 

• • . ..5 . 

La sequence NH2-terminale' de la proteine COBO (figure 47) 
correspond exactement a la sequence NH2-terminale de la 
cob(I)alamin adenosyltransferase, si ce n'est que dans la sequence 
25 presentee sur la figure 47, p line methionine precede la sequence 

peptidique determinee par sequengage direct. Il en resulte que la 
methionine aminoterminale est certainement excises in vivo par la 
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methionine aminopeptidase (Ben Bassat et Bauer, 1987). Le 
poids moleculaire de la cob(I)alamin adenosyltransf erase 
purifiee est estime par electrophorese PAGE-SDS a 28 000. La 
proteine COBO a \in poids moleciilaire dSduit de sa sequence de 24 000 
5 (figure 47). Les correspondences ehtre les sequences NH2-terminales et 
les poids moleculaires indiquent clairement que la proteine COBO 
correspond a la cob(i)alamin adenosyltransferase . Le gaie cobO est le 
g^e de structure de la cob(X)alamin adenosyltransferase. 

6.1.10. Identification de la proteine COBN codee par le g&ie 

10 cobN. 

a) Mise en evidence de I'activite de transformation de 
I'acide hydrogenobyrinique a,c-diamide en acide cobyrinique 
a,c-diamide. 

Get example illustre la raise en evidence d'une activite 

15 enzymatique directement liee a , la voie de biosynthese des cobalaraines 
qui n'a jusqu'a ce jour jamais ete decrite. Il s'agit de I'activite 
de transformation de I'acide hydrogenobyrinique a,c-diamide en acide 
cobyrinique a , c-diamide . 

Cette activite est mise en Evidence, entre autres, par 1' experience 
20 typique suivante. Un extrait brut de la souche SC510 Rifr est obtenu par 
sonication de 10 g de cellules humides dans 20 ml de tampon Tris/HCl 
0.2 H pH 8.0, puis elimination des d4bris cellulaires par 

centrifugation durant 1 h a 50 000 x g. 1000 mg de proteines de cet 
extrait sont incubes 1 h a 30 *C avec de I'acide hydrogenobyrinique 
25 diamide marque au carbone 14 (32 nmol; 50 pCi/pmol) dans 40 ml de 
tampon Tris/HCl 0.2 M pH 8.0 nontenant 7 mM ATP, 200 pM CoCl2 . La 
reaction est arretee par addition de 7.5 ml KH2P04 1M et 6 ml KCN 0.3 
M suivi du chauffage pendant 10 min S 80 *C. Apres 

centrifugation a 15000 x g durant 15 min, 1' analyse CLHP du surnageant 
montre: (1) la formation durant 1' incubation de 19.2 nmol d' acide 

cobyrinique a, c-diamide ayant la meme radioactivite specif ique que 
I'acide hydrogenobyrinique a, c-diamide de depart et (2) la disparition 



30 
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d'une quantite correspondante de ce dernier. Pour confirmer qu'il 
s'agit bien d'acide col^i;inigue a,c-diamide, le produit est purifie par 
CLHP puis esterifie dans du methanol contenant 5% d'acide sulfurique 
(18h, 20*0. L'autheiiticite de 1' ester pentamethyligue de 

5 I'acide cobyrinigue a,c-diamide produit est demontre par TLC (par 
rapport a un echantillon de reference) .^et spectrometrie de masse. 
Notons gue dans des conditions similaires d' incubation ou le 

marguage radioactif est introduit non pas dans I'acide 
hydrogenobyrinigue a,c-diamide mais dans le cobalt (en utilisant 
10 le cobalt 57), de I'acide cobyrinigue a,c-diMide marque au cobalt 
57 est biosynthetise et les memes conclusions ont pu etre tirees. 
L'acide hydrogenobyrinigue: a, c-diamide marque au carbone 14 est obtenu 
de la maniere suivante: I'acide hydrogenobyrinigue est biosynthetise in 

vitro en utilisant le (^ethyl-HClSAM ,]^uis transforme en acide 
15 hydrogenobyrinigue a, c-diamide et purifie par CLHP comme decrit a 
1' example 6.1.2. 

Cette etude demontre gue 1' insertion du cobalt a lieu au niveau de 
I'acide hydrogenobyrinigue a, c-diamide , chez P.denitrificans. Dans les 
conditions decrites, I'acide hydrogenobyrinigue n'est pas substrat de la 
20 chelation enzymatigue par le cobalt. 

b) Dosage et purification d'une proteine de la souche SC510 Rifr 
impliguee dans la transforation de I'acide hydrogenobyrinigue 
a, c-diamide en acide cobyrinigue a, c-diamide. 

La fraction a doser (0.5 a 2 luiit^s) est incubee pendant 60 min a 30 

25 *c avec 50 pi d' extrait brut de la souche SC510 Rifr obtenu comme 

decrit ci-dessus, 7 mM ATP, 20() CoC12, 7 pM acide 

hydrogenobyrinigue a, c-diamide margue au carbone 14 (50 pCi/pmol) 

dans 400 pi de tampon Tris/HCL 0.1 M pH 8.0. La reaction est arretee 
par addition de 75 pl_KH2P04 1 M et 60 pi KCN 0,3 M, puis chauffage 

30 pendant 10 min a 80 *G. Apres centrifugation a 15000 x g durant 15 

min, le sumageant est analyse par CLHP, pour quantifier I'acide 
cobyrinigue a, c-diamide forme (Cf exemple 9)-. L'unite d'activite 
enzymatigue est definie comme la gu^tite d' enzyme necessaire pour 
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generer 1 nmol d'acide cobyrinigue a/C-diamide par h dans ces 
conditions. Dans ces conditions, il apparait gue les extraits de la 
souche SC510 Rifr dans laguelle on a introduit le plasmide pXLl909 
(voir example 4.5.2) presentent une activite entre 20 et 50 fois plus 
5 elevee gue les extraits de la souche SC510 Rifr. C'est sur cette base 
gu'est purifiie une proteine, seule responsable de cette amplification 
d' activite. 

Dans une experience typigue de purification, 10 g de cellules humides de 
la souche SC510 Rifr dans laguelle on a introduit le plasmide 
10 pXL1909 sont suspendues dans 20 ml de tampon Tris/HCl 0.2 M pH 8.0 et 

soniguees durant 30 min a 4*C. L' extrait brut est ensuite recupere par 

centrifugation dinrant 1 h a 50 000 x g et dessale sur colonnes PD10 

(Pharmacia) eguilibrees avec du tampon 0.1 M Tris/HCl pH 8.0 

(tampon A). La solution proteigue est ensuite fractionnee (213 mg de 
proteines a chague chromatographie) sur une colonne Mono Q HR 10/10 
(Pharmacia) a I'aide d'un gradient de 0 a 0.5 H KCL dans le tampon A, 
puis les fractions contenant 1' activite sont poolees, concentrees par 

ultrafiltration, dessalees svu: coloimes PD10 (Pharmacia) eguilibrees 
avec le tampon 0.1 M Tris/HCl pH 7.2 (tampon B), et 

20 chromatographiees sur une colonne Mono Q HR 10/10 (Pharmacia) a I'aide 
d'un gradient de 0 a 0.5 M KCL dans le tampon B. Les fractions 
contenant 1' activite sont poolees, concentrees par ultrafiltration, 
dessalees sur colonnes PD10 (Pharmacia) eguilibrees avec le 
tampon B, et chromatographiees sur une colonne Mono Q HR 5/5 
25 (Pharmacia) a I'aide d'un gradient de 0 a 0.5 M KCL dans le tampon B. 
Pour parfaire la purification, la proteine est finalement 
chromatographiee sur une colonne Bio-Sil 250 (Bio-Rad) eluee avec 
20 mM potassium phosphate-50 mM sodium sulfate, pH 6.8. 

Apres cette etape, 1' enzyme est pure a plus de 95%. Elle ne presente 
30 aucune proteine contaminante en PAGE-SDS. Son poids moleculaire 
dans cette technigue est de 135 000. Ce degre de purete est confirms 
par l'unicit4 de la seguence NH2-terminale . Les differentes etapes de 
purification de la proteine de la souche SC510 Rifr impliguee dans 
la transformation de I'acide hydrogenobyrinigue a, c-diamide en acide 
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cobyrinique a,c-diamide, avec leur facteur de purification et leur 
rendement sont portees sur le tableau qi-dessous. 

Tableau: ' Purification d'une ^jiroteine . de la souche SC510 Rifr 
impliquee dans la transformation de I'acide hydrogenobyrinique 
3 a,c-diamide en acide cobyrinique a,c-diamide. 



10 



15 



c) Sequence NH2-terminale de la proteine impliquee dans la 
transformation de I'acide hydrogenobyrinique a,c-diamide en 
acide cobyrinique a,c-diamide de , Pseudomonas denitrificans et 
identification du gene de structure de Pseudomonas denitrificans 
20 codant pour cette actiyite . ^ 

La sequence NH2-terminale de cette proteine purifiee comme 
decrit a 1' example 6.1.10b) a ete determinee comme deer it 
precedenunent . Six residue ont. ete identifies: 

His-Leu-Leu-Leu-Ala-Gln 

25 La sequence NH2-terminale de la proteine COBN (figure 47) 
correspond exactement a la sequence NH2-terminale de la proteine 
purifiee, si ce n'est que dans la sequence presentee sur la figure 
47 , une methionine precede la sequence peptidique determinee par 
sequenqage direct. II en resulte que la methionine aminoterminale 



Etape de 
purification 


vol 

(ml) 


Prot4ines 

(mg) 


Activite spe. 
(u/mg de 
protdines) 


Rendement 


Facteur de 
purification^ 


Extrait brut 


31 . 5’ 


1278 ■ 


0.23 


- 


_ 


MonoQ 10/10 


44 


79.2 


2.4 


64 


10 


MonoQ 10/10 


21 


33.6 


6.8 


78 


30 


MonoQ 5/5 


3 


6.6 


16.0 


36 


70 


Bio-Sil 250 


1.8 


5.9 


16.3 


33 


71 
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est certainement excisee in vivo par la methionine aminopeptidase (Ben 
Bassat et Bauer, 1987). Le poids moleculaire de la proteine purifiee 
est estime par electrophorese PAGE-SDS a 135 000. La proteine 
COBN a un poids moleculaire deduit de sa sequence de 138 000 (figure 
3 47). Les correspondances entre les sequences NH2'terminales et les 

poids moleculaires indiquent clairement cjue la proteine COBN correspond 
a la proteine impliquee dans la transformation de I'acide 

hydrogenobyrinique a,c-diamide en acide cobyrinique a,c-diamide. Le 
grae cobN est done le g^e de structure de cette proteine. 

10 6.1.11. Identification de la proteine COBP codee par le 

grae CobP. 

a) Dosage de I'activite cobinamide kinase. 

Cet exemple illustre le dosage d'une activite enzymatique de la voie 
de biosynthese des cobalamines qui n'a jusqu'a ce jour jamais ete 
etudiee. II s'agit de 1' activite cobinamide kinase. Elle catalyse la 
phosphorylation ATP-dependante du groupement hydroxyl du residu 
(R)-1-amino-2-propanol du Ado-cobinamide pour generer le cobinamide 
phosphate . 

La fraction a doser est incubee a l'obsc\irite a 30 *C pendant 60 min 
20 dans 500 pi de tampon 0.1 M Tris-HCl pH 8.8 contenant 1 mM EDTA, 1 

mM ATP, 2.5 mM MgC12, et 16 pM Ado-cobinamide (Blanche et al., 1989), 

La reaction est stoppee en ajoutant 500 pi d'une solution aqueuse 20 mM 

de cyantjre de potassium. Apres chauffage a 80 *C durant 10 min et 
centrifugation a 5000 x g durant 10 min, le cobinamide phosphate 
25 forme present dans le sumageant est dose par CLHP (Cf exemple 9) en 
utilisant le gradient lineaire simplifie suivant: de 25% a 30% de B 
dans A en 15 min, puis 30% a 100% de B en 12 min, et 3 min a 100% de 
B. 

L' unite d' activite est definie comme la quantite d' enzyme necessaire 
30 pour generer 1 nmol de cobinamide phosphate a partir du 
cobinamide par h dans ces conditions. 
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b) Dosage de I'activite cobinamide phosphate guanylyl transferase. 

Get exemple illustre le. dosage d'une activite enzymatique de la voie 

de biosynthese des cobalamin^^ qul , n'a jusgu'a ce jour jamais ete 

etudiee. II s'agit de 1' activite cobinamide phosphate 
5 guanylyltransf erase. Elle catalyse 1' addition de la partie GMP 

d'une molecule de GTP sur I'Ado-cobinamide phosphate, generant 
ainsi une molecule de GDP-cobinamide et liberant une molecule de 

pyrophosphate. 

Cette activite est dosee dans les memes conditions que la cobinamide 
10 kinase si ce n'est que 1 ' Ado-^cobinamide phosphate (16 [jM) (B lanche et 
al., 1989) et le GTP (2 mM) : remplacent J.' Ado- cobinamide et I'ATP 

respect ivement , durant 1' incubation. 

L'unite d'activite est def inie .. quantite d'enzyme necessaire 

pour generer 1 nmol de GD?-cobinamide a partir du cobinamide 
15 phosphate par h dans ces conditlpns. 

c) Purification de la cobinami4®;:;^nase. 

A partir du dosage decrit a 1^ exemple 6. 1 . 1 la) , la purification de la 
cobinamide kinase de Pseudomonas denitrificans est realises comme 
decrit gi-dessous. 

20 Dans une experience typique de purification, 5 g de cellules humides 
de SC510 Rifr dans laquelle on a introduit le plasmide pXL623 (voir 
exemple 4.5.2) sont sqniques dans 20 ml de tampon Tris 0.1 M pH 7.6 
(tampon A). Apres centrifugation (50 000 x g. durant 1 h) et dialyse 4 h 
contre le tampon A, 4.5 ml du retent at sont injectes sur Mono Q HR 10/10 
25 (Pharmacia), equilibree avec le tampon A. Les proteines sont eluees 
avec un gradient lineaire de 0.4 M NaCl et les fractions actives 
regroupees sont passees a trayers une colonne de PD-10 (Pharmacia) 
iquilibrSe dans du Tris-H(U , 30 nM-phpsphate da potassivun 5 

mM-chlomre de calcium 5 pM pH 7.6 (tampon B). La solution proteigue 
est fractionnee siir une colormia, Bio-(Jel _,,jHPHT (Bip-Rad), equilibree 
dans le tampon B et eluee avec up gradient de 5 a 350 mM de phosphate de 



30 
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potassium. Les fractions actives sont regroupees et amenies a 500 
mM en sulfate d'ammonium, puis fractionnees sur une Phenyl -Super ose 
HR 5/5 (Pharmacia), eluee avec un gradient decroissant de sulfate 
d'ammonium. la fraction contenant I'activite est finalement 

^ repurif iee sur une colonne Mono Q HR 5/5 dans le Tris-HCl a pH 7.3. 
Apres cette etape, la proteine est pure § plus de 97%. Elle ne 
presente aucune proteine contaminante en PA6E-SDS. Cette purete est 
confirmee par I'unicite de la sequence NH2-terminale. Son poids 
moleculaire dans cette technique est de 20 000. Les differentes 

10 etapes de purification de la cobinamide kinase avec leur facteur de 
purification et leur rendement sont portees svu: le tableau A. 

Les fractions contenant I'activite cobinamide kinase presentent 

aussi I'activite cobinamide phosphate guanylyltransf erase. D' autre part, 
comme le montrent les resultats presentes dans le tableau gi-dessus, le 
15 ratio de ces devix activites reste constant dans les fractions tout 
au long de la purification. Enfin, la proteine purifiee presente un 
tres haut degre de piirete depassant les 97%. L' ensemble de ces 

resultats indiquent done sans ambiguite qu'une seule et meme proteine 
est responsable des deux activites successives que sont la 
20 cobinamide kinase et la cobinamide phosphate guanylyltransferase de 
la voie de biosynthese des cobalamines chez Pseudomonas 

denitrif icans . 

d) Sequence NH2-terminale de la cobinamide kinase-cobinamide 

phosphate guanylyltransferase de Pseudomonas denitrificans et 

25 identification du gene de structiire de Pseudomonas denitrificans codant 
pour cette activite. 

La sequence NH2-terminale de la cobinamide kinase-cobinamide 

phosphate guanylyltransferase de Pseudomonas denitrificans a ete 
determinee comme decrit prec^emment. Dix residus ont ete identifies: 



30 Ser-Ser-Leu-Ser-Ala-Gly-Pro-Val-Leu-Val 
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La sequence NH2-tenninale de la prpteine COBP (figure 47) 
correspond exactement a cette sequence, si ce n'est que dans la sequence 
presentee sur la figure 47, une methionine precede la sequence 
peptidique determinee par 'feequ^gage direct. II en resulte que la 
5 methionine aminoterminale est ‘certainement excisee in vivo par la 

methionine aminopeptidase (Ben Bassat et Bauer, 1987). Le poids 
ffloleculalre de la coblhamide ' kinase-cobinamide phosphate 
guanylyltransferase purifiee est estime par electrophorese PAGE-SDS 
a 20 000. La proteine COBP a un poids inoleculaire deduit de sa 

10 sdquence de 19 500 (figure 47). Les correspondances entre les 

sequences NH2-terminales et les poids moleculaires indiquent 

clairement que la proteine COBP correspond a la cobinamide 

kinase-cobinamide phosphate guanylyltrainsf erase . Le gene cobP est le 
gene de structure de la cbbinamide kinase-cobinamide phosphate 

15 guanylyltransferase. ■; n 

i ; .. , . ; 

6.2 — Determination des proprietes det "proteines COB par mesures 
d* intermedi aires de bipsynthese acciimules 

Cet example il lustre 'comment il est possible d'attribuer a 
une proteine COB de Pseudomonas denitrify <-ans une activite 
20 enzymatique. Cette activite e0t attribute d'apres des donnees obtenues 
concemant les intermediaires 'de biosynthese accumules chez le ou les 

I. 

mutants Cob bloques dans I'etape en question. En effet si un mutant 
accumule un intermediaire de biosynthese, il est tres probable que ce 
mutant est bloque dans l^etape qui a pour substrat 1 ' intermediaire en 
25 question. 

6.2.1. Proprietes des protiines COBC et COBD 
Les mutants Cob G643 ( Aarobaeterium tumef aeiens ) et G572 
( Pseudomonas put ida ) dejii decrits dans les exemples 1 et 4 sont 
bloques dans I'etape cdrrespbndant k la prot4ine COBC. En effet ces 
30 deux mutants ne sont pas "complementes par les iiisertions inactivantes 
de transposons Tn5 qui se' tiJOuvent dans let gene cobC . Les deux souches 
G643 et G572, ainsi que les’ Souches p'arehtes non mutees [C58-C9 Rif*" 
et KT 2440 Rif'' (Cameron et ^., 1989)] ont ete cultivees en milieu 
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PS4^ pour les A.tumefaciens, et PS4" pour les P.putida (PS4' et PS4'' 
correspondent a du milieu PS4 contenant respectivement 100 et 1000 
fois moins de cobalt que le PS4 decrit precedemment ) 3 joiirs comme 
cela est decrit ci-dessus. Du ^^CoCl 2 a ete ajoute aux cultures (2,5 
3 pCi/0,1 pn pour une culture de 25 ml). Les corrinoides 

intracellulaires ont ete isoles sous leur forme native et identifies 
par leur comportement CLHP. Les souches parentes n'accumulent pas de 
corrinoides autres gue du coenzyme Bx 2 - Las deux mutants, G643 et 
G572, accumulent de I'acide cobyrique adenosyle dans des proportions 
10 respectives de 11 % et 6 %. Ces proportions en % sont calculees par 
rapport au niveau de coenzyme B 12 synthetise par la souche parents. 
Outre I'acide cobyrique, le mutant G643 accumule de I'acide 
cobyrinique pentaamide dans ime proportion de 2 %; I'acide cobyrinigue 
pentaamide est I'intermediaire qui precede iracide cobyrique. L' etude 
13 de ces mutants fait ressortir qu'ils sont blogues apres I'acide 

cobyrique. Tous ces mutants Cob sont soit blogues entre l^uro'gen III 
et le cobinamide, soit entre le cobinamide et les cobalamines. Les 
mutants G643 et G572 sont blogues entre I'xiro'gen III et le 
cobinamide. Or si ces mutants sont blogues avant le cobinamide et 
20 accumulent tous les deux de I'acide cobyrique, les proteines pour 

lesquelles ils codent ne peuvent intervenir gue dans I'etape 
enzymatique (appelee cobinamide synthase) qui catalyse I'amidation de 
I'acide cobyrique par un residu aminopropanol pour donner le 
cobinamide; elles peuvent aussi eventuellement intervenir dans la 
25 synthese du sxabstrat de la reaction qui apporte 1' aminopropanol, si ce 
n'est 1' aminopropanol lui-meme. Le gene cobC code pour une proteine 
qui est soit la cobinamide synthase, soit une de ses sous-unites. 

Le mutant Cob G634 d^ Aorobacterium tumef aciens qui est 
bloque dans I'etape correspondant au g^e cobD a ete analyse de la 
30 meme maniere. Ce mutant n'est pas complemente par les insertions 

inactivationnelles dans le gene cobD { exemple 4.1). Le seul corrinoide 
intracellulaire trouve chez ce mutant est de I'acide cobyrique 
ad^osyle. Comme les mutants precedents, ce mutant code pour une 
proteine intervenant dans la transformation de I'acide cobyrique en 
35 cobinamide ou bien eventuellement dans la synthese de 1^ autre substrat 
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de la reaction. 

Ces deux g^es differents ( cobC et cobD ) codent pour deux 
proteines qui interviennent dans la meme etape. 

6.2.2. Froprietes des proteines COBF a COBH 
5 Lbs mutants d^ Aorobacterium tumefaeiens deja decrits dont 

on connait, d'apres 1 ' etude decrite a I'exemple 4.2, dans quels genes 
chacun d'entre eux est bloquS> ont ete Studies. Ce sont les mutants : 
G612 (cobF), G615 ( cobG ). G616 ( cobH ). G613 ( cobl l . G61 1 (cpbJ) , G620 
( cobK ) , G638 (cpbL) et G609 ( cobM ) ; nous avons figure entre 
10 parentheses le gene de Pseudomonas denitrificans responsable de la 
complementation de ces mutants (example 5) qui correspond done au gene 
mute chez ce mutant. Ces mutants ont ete cultives en milieu PS4 comme 
cela est decrit precedemment avec du cobalt marque. Apres quatre jours 
d' incubation, les mutants ont ete analyses pour leur contenu 

1^ intracellulaire en corrinoides et descobaltocorrinoides (Cf examples 
6.1.2 et 9). 

Tableau : Intermediaires accumules par des mutants d' Aorobaeterium 
tumefaeiens bloques dans les genes du fragment 8,7 kb de Pseudomonas 
denitrificans 
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HAB : acide hydrog&iobyrinique 

HABM : acide hydrogenobyrinique monoamide 

13 HABD : acide hydrogenobyrinique diamide 

* en fait il s'agit de la souche C56-C9 Rif‘‘Nal'^ deja decrite (Cameron 

et al., 1989) 

^les valeurs sont exprimees en % des mimes intermediaires accumules 
Chez la souche parente non mutee C58-C9 Rif^'Nal'’. 

20 Ces resultats montrent que tous les mutants n'accumulent 

aucun corrinoide (a 1' exception du mutant inactive dans le gene cobF . 
6612, qui lui, accumule du cobinamide mais a un niveau faible 
equivalent a 2,2 % des cobalamines synthetisees par la souche non 
mutee). Toutefois, certains mutants (6612, 6615 et 6616) ont des 

23 niveaux de cobalamines qui representent plus de 10 % du niveau de 
cobalamines de la souche parente. Il est probable que tous ces mutants 
sont bloquis au moins avant 1' acide cobyrinique diamide. Tous ces 
mutants accumulent de 1' acide hydrogenobyrinique et de 1' acide 
hydrogenobyrinique diamide en quantites inferieures a la souche non 



'p 

S ouches 


Descobaltocorrinoides 
intraceiiuiaires en % ^ 


.Corrinoides intraceiiuiaires 
en % des cobalamines 


Gene 

mut6 




HAB 


HABM 


HABD 






C58-C9’ 


100 


100 


100 


coenzyme 


- 


6612 


< 5 


< 5 


64 


cobinamide 2,2 
coenzyme 


cobF 


6615 


< 5 


< 5 


84 


coenzyme 


cobG 


6616 


35 


< 10 


< 10 


coenzyme 


cobH 


6613 


< 5 


< 5 


57 


coenzyme 


cobi 


6611 


< 5 


< 5 


65 


coenz3one B^2 


cobJ 


6620 


12 


< 5 


< 10 


coenzyme B ^2 


cobK 


6638 


< 5 


< 5 


47 


coenzyme B^^j 


cobL 


6609 


< 5 


■ < 5 1 


33 


coenzyme B ^2 <1 


cobM 
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mutee; ils sent done tres probablement bloques avant I'acide 
hydrog4nobyrinique . Nous pouvdns conclure qua tous les genes cobF a 
cobG codent pour des proteines qui interviennent avant I'acide 
hydrogenobyrinique. On sait que le mutant G6 13 est mute le gene 
cobi qui code pour la SPjMT, intervenant bien avant I'acide 
hydrogenobyrinique. Pour ce mutant, les resultats dii present exemple, 
concemant 1 ' accumulation d'ihtermediaires, sont en parfait accord 
avec I'etape inactivee chef ce mutant, a savoir que ce mutant 
n'accumule aucun intermediaire apres I'acide hydrogenobyrinique a un 
niveau superieur a ce que I'on observe avec la souche non mutee. Ce 
resultat est pour les genes cobF , cobJ . cobL et cobM coherent avec 
ceux de 1' exemple 6.4 ou il est propose que ces g^es codent pour des 
proteines qui catalysent des transferts de methyl SAM dependants et 
done qui interviennent avant I'acide hydrogenobyrinique. A 1' exception 
de cobI qui est le gene de structure de la SPjMT ces genes 
interviennent apres le precorr^e-3. En effet comme ce ne sont ni les 
genes de structure de la SUMT et de la SPaMT ils interviennent 
forcement apres, e'est-a-dire apres le precorrine-3 (tous les genes 
cob decrits dans la presente invention interviennent entre I'uro'gen 
111 et les cobalamines ) . Ces genes cobF a cobH et cobJ a cobM codent 
pour des enzymes qui interviennent entre le precorrine-3 et I'acide 
hydrogenobyrinique . 



6.2.3. Proprietes £des proteines COBS et COBT 

Le mutant G2035 decrit dans les examples 1 et 4.3 est 
25 bloque dans I'etape correspondent a la proteine COBS. Le mutant G2037 
decrit dans 1' exemple 1 est bloque dans -I'etape correspondent a la 
proteine COBT. Ces souches aiiiisi que la sOuche parents (Agrobacterium 
tumefaciens C58C9Rifr) sont cultivees- en milieu PS4' (il s'agit du 
milieu PS4 ou la concentration Sh chlorure de cobalt est 100 fois plus 
30 faible que dans le milieu PS4) en presence de cobalt radioactif 
57COC12 pendant 3 jours, leur contenu intracellulaire en 
descobaltocorrinoides est anSlyse ainsi que le contenu en corrinoides, 
comme cela a deji ete decrit di-dessus (Cf exemple 6.2.2). Les souches 
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G2035 et G2037 n'acciamulent pas de corrinoxdes et de larges 
concentrations (superieures a celles observees avec la souche parente) 
en acide hydrogenobyrinigue et acide hydrogenobyriniqfue mono et 
diamide ne sont present es qu'avec la souche G2035. Ce mutant est 
5 probablement bloque dans \me etape situee apres 1' acide 

hydrogenobyrinigue diamide et avant 1' acide cobyrinique diamide. Par 
consequent le g&ie CobS coderait pour une des enzymes impliquees dans 
la transformation de 1' acide hydrogenobyrinigue diamide en acide 
cobyrinique diamide; cette proteine peut done intervenif soit dans 
10 1' insertion du cobalt, soit dans la reduction du cobalt de 1' acide 

cobyrinique a,c-diamide nori adenosyle. Par contre, le mutant G2037 
serai t bloque dans une etape situee en amont de 1^ acide 

hydrogenobyrinigue. Le gene cobT coderait pour une proteine impliquee 
dans une etape enzymatique en amont de 1' acide hydrogenobyrinigue et 
15 en aval du precorrine-3 {d'autres genes de structure codant pour les 
enzymes impliques en aval du precorrine-3 ont deja ete identifies). 
Une autre possibilite pour la proteine COBT est qu'elle intervienne, 
comme cela est propose a 1' example 5, comme proteine liant le cobalt, 
et/ou comme proteine qui interagit avec d' autre (s) proteine (s) par sa 
20 partie acide. 

6.2. 4 • Proprietes de la proteine COBV 

Les mutants G2039 et G2040 decrits dans les examples 1 et 
4.4 sont bloques dans 1' etape correspondant a la proteine COBV. Ces 
souches ainsi que la souche parente sont cultivees en milieu PS4' 
25 pendant 3 jours en presence de cobalt radioactif 57CoC12, puis leur 
contenu intracellulaire en descobaltocorrinoides est analyse et le 
contenu en corrinoxdes est determine, comme cela est decrit dans 
1^ example 9. Les souches G2039 et G2040 accumulent de 1" acide 
cobyrique, du cobinamide, du cobinamide phophate et du GDP-cobinamide . 
Ces mutants sont probablement bloques dans une etape enzymatique en 
aval de la GDP-cobinamide. Le gene cobv coderait poxar xine enzyme 
impliquee dans la transformation de la GDP-cobinamide en cobalamine, 
voir figure 5. Ce resultat est eh parfait accord avec I'activite 



30 
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cobalamin (5' -phosphate) synthase de la proteine COBV qui possede 
I'Ado-GDP-cobinamide conune siihstrat. 




6.3 - Determination de 1/ activity de proteine^ COB par etudes 



d'af finite vis-a-vis du SAM 



Get e^emple illustre cononent il est possible, a partir de 
prot4ines COB purifiees de Pseudomohaa denitrif leans , de mettre en 
evidence in vitro urie activite de fix^ioh du SAM. Si une proteine COB 
possede une telle activite, cela signifie igue cette proteine COB est 
une methyltransferase'*’ de. la voie et qu'elle intervient dans un des 
transferts des huit groupements methyl qui se produisent entre 
I'uro'gen III et I'acide cobyrinique. 



6.3.1. Test dfaf finite pour le SAM sur une proteine 

purifiee 

Le test repose sur le . principe suivant lequel les 
15 methyltransf erases de la voie de biosynthese des cobalamines ont 

certainement un site de fixation du SAM. €e site doit etre mis en 
evidence par une af finite du SAM plus elevee que pour toute proteine 
qui ne fixe pas le SAM specif iquement . Apres incubation de la proteine 
a etudier en presence d'luf exces de SAM radioactif, celle-ci est 

20 separee du SAM libre par une chromatographie de permeation de gel. La 
radioactivite retrouvee dans ; la fraction du poids moleculaire de la 
proteine correspond au SAN fixe durant 1' incubation. La 

chromatographie est. effectuee a 2*C pour limiter au maximum la 
liberation du SAM lie diirantr'la separation. 

25 La proteine ' ( environ 10 pg) est iheubee durant 10 minutes 

a 30*C dans 200 pi de Tris-HCl .i0,1- \M pH 7,7 avec 5 nmoles de 

[ methyl -SAM (1 pCi). Apres incubation, 100 pi du melange sont 

immediatement injectes sur une colonne de TSK-125 (Bio-Rad) eluee a 
1 ml/minute avec le melange - de sullate de sodium 50 

30 mM/dihydrogenophosphate de sodium 20 mM pH ; 6,8 preconi se par le 
distributeur de cette colonne. Des fractions de. 0,5 ml sont collectees 
et comptees en scintillation liquide. Lies temps de retention de la 
proteine et du SAM* sont obtenus: dtrectement d^ apres I'enregistrement 
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de 1' absorbance de I'eluat a 280 nm. 

6.3.2. Etude in vitro de la fixation du SAM sur les 
proteines COBA et COBF de Pseudomonas denitrificans 

a) Purification des proteines COBF et COBA 
5 La proteine COBF de Pseudomonas denitrificans est purifiee 

comme cela est decrit ci-apres. Dans une experience typique de 
purification, 5 g de cellules humides de la souche SCI 50 Rif^'dans 
laguelle a ete introduit le plasmide pXLl546 ( voir ex. 7. 3) obtenues 
apres culture en milieu PS4 sont resuspendues dans 30 ml de Tris-HCl 
10 0,1 M pH 7,7 et soniquees durant 15 minutes a 4'C. L' extrait brut est 

ensuite recupere par centrifugation 1 hevure a 50 000 g et le 

surnageant est passe sur une colonne de DEAE-Sephadex (1 ml de gel) 
pour eliminer les composes tetrapyrroliques presents. 10 mg de 
proteines (0,7 ml) de cet extrait sont ensuite injectes sur une 
15 colonne de MonoQ HR 5/5 equilibree avec le meme tampon. Les proteines 

sont eluees avec un gradient lineaire de KCl (0 a 0,25 M). La proteine 
COBF est 4luee avec 0,20 M de KCl. Elle est diluee deux fois avec du 
Tris-HCl 0,1 M pH 7,7 et purifiee une seconds fois sur une MonoQ HR 
5/5. L'electrophorese en PAGE-SDS avec revelation au bleu de Comassie 
20 est utilisee pour visualiser la proteine. Cette technique montre 

d' autre part que COBF est d'une purete de 95 % environ apres cette 
etape de purification. La sequence NH 2 -terminale de la proteine 
purifiee a ete realises comme cela est decrit precedemment . Deux 
sequences NH 2 -terminales apparaissent en meme temps sur cheque cycle 
25 de degradation; ce sont les sequences suivantes d^s les proportions 
indiquees : 

Sequence 1 (34 % d'abondance) 

1 2 3 4 5 6 7 8 9 10 11 

Ala Glu Ala Gly Met Arg Lys He Leu He He 

30 Sequence 2 (66 % d'abondance) 

1 23456789 10 11 

Met Arg Lys He Leu He He Gly He Gly Ser 

La sequence 1 correspond a la sequence NH 2 -terminale de la 
proteine COBF qui est donnee sur la figure 16, si ce n'est que la 
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methionine aminoterminale est 'excisee' suivwt des regies deja enoncees 
(Hirel et §1., 1989) par la methionine aminopeptidase (Ben Bassat et 
Bauer, 1989). La sequence 2, ‘presente eh quantite la plus importante, 
correspond a la meme proteins hais dont 1' initiation de traduction se 
3 serait f aite non pas au coddh ATG d' initiation de la traduction que 
nous avions suppose, mais i diliii situe 5 codons en aval sur la phase 
codante (figure 16). ^ effet les acides amines de cette sequence sont 
exactement ceux que I'on trouve sur la sequence de la proteine COBF a 
partir de la deuxi^e methiohine (acide amine n* 6) de cette sequence 
10 (figure 16). Dans ce cas la methionine aminoterminale n'est pas 
excisee ce qui confirme les deja ^oncees (Hirel et al*, 1989). 

II y a Chez la souche SC5T0 Rif ^ pbrtarjt le plasmide pXLl546, deux 
initiations de traduction, d'une part Celle correspondant au codon 
methionine positionne a la bicSnrie distance, sur notre construction, de 
15 la sequence de Shine et Delgamo et d' autre part celle qui se fait au 
deuxieme codon methionine se trouvant sur la sequence du gene cobF 
presente a la figure 16. De cela/ il ressort que probablement la 
proteine COBF commence non j^as a la methionine indiquee sur la figure 
16 mais a celle se trouvant S acides amines plus loin. 

20 De toute manidreV' ce resultat montre qu'il s'agit bien de 

la proteine COBF qui est ei^rimee et que celle-ci est exprimee avec 
une forme allongee de 4 adides amines. Lors de la purification les 
deux formes proteiques .sip^t piirifiSes. Dans det exemple, nous 
appellerons proteine COBF' purifiee le melange de ces deux proteines 
25 purifiees. 

La proteine COBA de Pseudomonas dehitrificans est purifiee 
comme cela est decrit precedemnient (Blanche et 1989). 

Fixation du SAM 

La fixation du SAli sur ces deux proteines est etudiee 
30 comme cela est decrit precedemment e 1' exemple 6.3. 1 .a) . La serum 
albumine bovine et 'la proteine COBH purifiee sont utilisees comme 
controles negatifs. Port les* proteine^ COBA et COBF on observe un pic 
de radioactivite a la sortie de la^coionne de TSK-125 au temps de 
sortie de ces proteines (figure 20). Dans ce test, la proteine COBI 
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presente la meme propriete de fixation du SAH. A I'oppose, il n'y a 
pas de tels pics de radioactivite avec la B5A et la proteine COBH. Ce 
test met en evidence la fixation ^ vitro du SAM sur les proteines 
COBA, GOBI et COBF. Ces resultats montrent que COBA, GOBI et COBF sent 
3 des SAM-methyltransf erases . Ce resultat est tout a fait en accord avec 
les activites de COBA et GOBI puisgu'il s'agit respect ivement de la 
SOMT et de la SP 2 MT de Pseudomonas denitrif icans . La proteine COBF est 
done probablement une SAM methyltransferase de la voie de biosynthese 
des cobalamines. Ce test confirms gue COBF est une methyltransferase. 

10 6.4 - Determination de I'activite de proteines COB par etudes 

d' homologies de sequences 

Get example illustre comment par des comparaisons entre 
les sequences de diverses proteines COB de Pseudomonas denitrificans 
il est . possible de trouver les proteines COB qui sont des 
13 SAM-methyltransf erases de la voie de biosynthese des cobalamines. 

Les proteines GOBI et COBA sont toutes les deux des SAM 
methyltransf erases de la voie de biosynthese. Ces de\jx proteines ont 
ete comparees suivant le programme de Kanehisa, 1984. Cette 

comparaison fait ressortir trois regions de forte homologie (figure 
20 21). Dans chacune de ces regions il y a plus de 45 % d'homologie 

stricte entre les deux proteines. Trois regions de forte homologie 

entre COBA et CYSG sont egalement presentees (figure 22); ce sont les 
memes regions de COBA qui presentent une forte homologie avec GOBI. 
Ces regions de fortes homologies entre COBA, CYSG et GOBI presentent 

25 de I'homologie avec d'autres proteines COB. Il s'agit des proteines 

COBF, COBJ, COBL et COBM (figure 23). En ce qui conceme.la region 1, 
les proteines COBF, COBL et COBH presentent des homologies 

significatives par rapport a toutes les proteines de Genpro, qui est 
une extraction proteique de Genbank (version 59) augmentee des parties 
30 codantes putatives superieures a 200 acides amines, suivant le 

programme de Kanehisa (1984). Bn ce qui conceme la region 2, les 
proteines COBJ, COBL et COBM presentent des homologies significatives 
par rapport a toutes les proteines de Genpro (version 59). En ce qui 
conceme la troisieme region d'homologie, COBJ, COBL et COBM 
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presentent des homologies significatiyes par rapport a toutes les 
proteines de Genpro (version 59). Les comparaisons de sequences 
permettent done de mettre en- evidence gue guatre proteines COBF, COBJ, 
COBL et COBM presentent des homologies significatives avec les regions 
3 conservees des sequences de trpis types de methyltransf erases COBA, 
GOBI et COBF. Les proteines COBG, COBH et COBK ne presentent pas 
d' homologies significatives avec les regions conservees des 
methylases. La proteine COBF ne presente d'homologie significative 
avec les autres proteines gue dans la region 1. Ces homologies doivent 
10 correspondre probablement au fait gue toutes ces proteines sont des 
methyltransf erases . Ce resultat recoupe les donnees biochimigues 
decrites sur COBF concemant la capacite gu'a cette proteine a lier le 
SAM in vitro (example 6.3). Ces homologies, d'une part, permettent de 
confirmer gue COBF est une SAM methyltransf erase de la voie de 
13 biosynthese des cobalamines etd' autre part mettent e'n evidence gue 
COBJ, COBL et COBM pourraient etre des SAM methyltransferases de la 
vole de biosynthese des cobalamines. Ces resultats roontrent egalement 
I'homologie qui existe entre les proteines COB de P.denitrificans et 
les proteines isofonctionhelles d' autres microorganismes . 

20 E3CBHPLE 6(B) - Purification et clonage du gene de structure de la SOHT 
de Mci-hano baeterii ™ ■ivanwii,- 

Cet example illustre comment il possible d'obtenir, dans d' autres 
microorganismes, des enzymes COB et des genes cob correspondents a ceux 
identifies chez P. denitrifieans . 

23 6(B). 1. Purification de la SUHI de Hethanobacterium ivanovii. 

Cet exemple deerit la purification de la SUMT de 

Hethanobacterium ivanovii et 1' etude de ses proprietes catalytiques . 

La souche de Hethanobacterium ivanovii DSM2611 est cultivee comme cela 
est deerit (Souillard et al., 1988). 12 g de cellules humides sont 
30 obtenus. Celles ci sont resuspendues dans 80 ml de tampon Tris/HCl 0.1 M 
pH 7.6 contenant 5 mM DTT et 1 'tdh EDTA et soniquees pendant 1h30 a 4 *C 
puis centrifugees diirant 1h a 50 000 g. L' extrait est ensuite debarasse 
de composes tetrapyrroligues libres par passage a travers une petite 
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colonne de DEAE*Sephadex A25 montee dans le meme tampon. Les proteines 
precipitant entre 55 et 75% de saturation en sulfate d' ammonium sont 
solubilisees dans un tampon Tris/HCl 0.1M pH 7.5, 0.5 mM DTT, 1.7 M 
sulfate d'ammoniism et injectees sur une colonne de Phenyl-Superose HR 
5 10/10 (Pharmacia France/SA), eluee* avec un gradient decroissant (de 1.7 
M a 0 M en sulfate dammonium) . Les fractions actives sont passees sur 
une colonne de Sephadex G-25 eguilibree avec du tampon Tris/HCl 0.1 M, 
pH 7.5, 0.5 mM DTT, glycerol 25% (tampon A) puis injectees sur une Mono 
Q HR 5/5 (Pharmacia France SA) eguilibree avec du tampon A et eluee avec 
10 un gradient de KCl de 0 a 0.3 M; cette etape est repetee une seconds 
fois dans les memes conditions. Une chromotographie de permeation de gel 
sur Bio-Sil TSK-250 (BioRad France SA) de la fraction active de 1' etape 
precedents permet d'obtenir une proteine homog^e en PAGE-SDS et en 
RP-CLHP (C-18 ^jBondapak) . Les differentes etapes de purification avec 
15 leur rendement ainsi gue leur facteur de purification sont decrites sur 
le tableau ci-dessous. 

Comme il est montre dans ce tableau, le facteur de purification 
total est de plus de 4 500. Des proprietes de 1' enzyme pure ont ete 
etudiees selon des methodes deja decrites (Blanche et al., 1989). Cette 
20 enzyme a bien une activite SUMT, c'est a dire, gu'elle catalyse bien le 
transfert de deux groupements methyls, SAM-dependant, en C-2 et en C-7 
de I'xiro'gen III. Le poids moleculaire de 1' enzyme estime par permeation 
de gel est de 60,000 +/- 1,500 tandis gue par PAGE-SDS il est de 29,000 
ce gui montre clairement gu'il s'agit d'une enzyme homodimerigue. Dans 
23 des conditions deja decrites (Blanche et al.,1989) 1' enzyme a Km pour 
I'uro'gen III de 52 +/- 8 nM. De plus, cette enzyme ne presente pas 
d' inhibition par son substrat a des concentrations inferieures a 20 |jM, 
alors gue la SUMT de Pseudomonas denitrificans presente une inhibition 
par I'uro'gen III a une concentration superieure a 2 (Blanche et al., 
30 1989). 

Tableau : Purification de la SUMT de M. ivanovii. 
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10 



.1/ calcule d'apres le rendem^t en proteines. 

La Vmax de la SUMT de M. ivariovii a ete determinee. Celle-ci est 
de 1537 U/mg de proteines. Cette valeur est superieure a celle trouvee 

pour la SUMT de P. denitrif leans deja determinee dans les conditions 

■■ • ^ 

15 optimales de la reaction (compte tenu de son inhibition par I'uro'gen 
III), 489 U/iag de proteines (Blanche et al . , 1989). 

6(B). 2. Clonage du g^e de structure de la SUHT de M. ivanovii 
Chez E. coli. 

6(B). 2.1. Clonage d'un fragment .interne au gene de structure de la SUMT 
20 de M. ivanovii. Pour ce fairej^ on proeede de la maniere suivante : 200 
picomoles de la SUMT de M. ivanovii sont utilis4es pour le seguengage 
NH2-terminal de la proteine cbnune cell est decrit precedemment . En 
outre, un fragment peptidique dbtenu par urte digestion trypsigue de la 
proteine est lui aussi soumis a xin seguengage de sa partie 
25 NH2- terminals. Les seguences otetjenues sent presentees svir la figure 48. 
Les oligonucleotides ;?ens et antisens fespectiment 946, .923 et 947 (voir 
figure 48) sont synthetises comme cela est decrit precedemment; ces 
oligonucleotides contiennent a |eur extremite 5' un site de restriction 
gui est soit EcoRI pour les gli^nucleotides sens soit Hindi! I pour 
1' oligonucleotide ^tisens. Ces ipligonucleotides sont utilises pour une 
experience d' amplification eni^^atigue de I'ADN (Saiki et al., 1988), 
comme cela est schematise sur la figure 48. B. 



Etape de 
purification 


voJL 

(ml) 


' • ' • fli: 

Proteines 

j 

(mg) 


Activity sp6. 
(u/mg de 
proteines) 


Rendement 


Facteur de 
purification^ 


Extra! t brut 


92 


731 7 


0.337 






55-75% SA 


7.1 


153 •' 


1.215 


76 


3.6 


Phinyl-superose 


9.5 


8.34 


15.35 


52 


46 


MonoQ 5/5 


1.0 


0.252 


422 


43 


1252 


Bio-Sil TSK 


1.0 


’ O.U61,f 


1537 


38 


4561 



30 
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L'ADN genomique de M. ivanovii est prepare de la maniere 
suivante: 0.4 g de cellules de M. ivanovii (DSM 2611) sont lavees avec 
une solution 0.1'5 M NaCl. Les cellules sont ensuite incubees dans 4 ml 
d'une solution de sucrose 25 %, Tris/HCl 50 mM pH 8, lysozyme 40 mg puis 
3 2 a 3 h a 50*C apres addition de 40 mg de proteinase K et de 5 ml d'une 
solution SDS 0.2 %, EDTA 0.1 M pH 8. L'ADN est ensuite extrait au 
phenol-chloroforme (50 %-50 %) 2 fois, puis 2 fois au chloroforme et 
ensuite precipite par 1' isopropanol et repris dans 3 ml de TNE (Tris/HCl 
10 mM pH 8, EDTA *1 mM, Na-Cl 100 mM). 

10 L' Amplification enzymatigue de I'ADN de M. ivanovii est 

effectuee suivant le protocole de Saiki et al., 1988, dans un volme de 
0.1 ml avec 600 ng d'ADN genomique de M. ivanovii, en utilisant les 
amorces 946 et 947 (reaction 1) ou 923 et 947 (reaction 2). Le tampon 
utilise pour cette reaction est MgC12 ImM, KCl 50 mM, gelatine 0.001 % 
15 et cheque dNTP a une concentration de 0.2 mM; pour cheque reaction 
d' amplification, 10 mg de cheque oligonucleotide sont utilises ainsi que 
2.5 unites de Tag DNA polymerase (Cetus Corporation). L' amplification 
est realisee s\ir 30 cycles dans le Perkin-Elmer Cetus DNA Amplification 
system; au coiirs de cheque cycle, I'ADN est denature 1 min a 95 “C, les 
20 amorces oligonucleotidiques sont hybridees a I'^ADN simple brin 2 min a 
38 *C et les neobrins sont polymerises pendant 3 min a 72 *C. Les 

produits d' amplification sont ensuite extraits au chloroforme et 
subissent ensuite une precipitation ethanolique; ils peuvent ensuite 
etre visualises apres migration sur gel d' acrylamide puis etre digeres 
25 par les enzymes de restriction telles que EcoRI et Hindlll. 

Dans le cas de la reaction 1, deux fragments sont observes : a 
615 pb ainsi qu'a 240 pb. En ce qui conceme la reaction 2, deux 
fragments sont aussi observes : a 630 et 170 pb. La totalite du produit 
d'une reaction d' amplification enzymatigue entre les oligonucleotides 
30 946-947 est separee par migration sue gel d' acrylamide; le fragment de 
615 pb est purifie comme cela est decrit precedemment . Ce fragment est 
ensuite digere par EcoRI et Hindlll afin de rendre les extreraites du 
fragment cohesives. Ce fragment est ensuite ligature avec de I'ADN de la 
forme replicative du phage Ml3mp19. La ligature est transformee dans E. 
coli TGI. Six clones recombinants, contenant un insert de 615 pb, sont 
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analyses par sequen^age avec le primer iiniversel -20 (Pharmacia SA, 
France). Comme il est montre sur. la figure 49, . lorsgue I'on sequence 
I'ADN simple brin des phages recombinants ^i contiennent 1' insert de 
615 pb, il doit etre observe, en aval du site EcpRi, une sequence non 
5 degeneree corrrespondant k celle de 1' oligonucleotide 946 suivie, dans 
la mime phase, par une sequence qui code pojir les acides amines 
LITLKAVNVLK7ADWL (? signifie qu'a cette position, le residu n'a pas pu 
etre determine); cette sequence correspond' a celle qui, dans la sequence 
NH2-terminale de ' la • SUMT, suit les. acides. amines correspondant a 
10 1' oligonucleotide 946 (voir figure 48).. Pour deux clones, il a 
effectivement eti. observe, apr|s le site EcoRI, une sequence pouvant 
coder pour la region NH2-termihiale de la SUMT de Methanobacterium 
ivanovii, celle-ci commengant par 1 ' enchainement Pro-Gly-Asp-Pro-Glu-Leu 
qui sont les acides amines codee par une sequence contenant 
15 1' oligonucleotide 946. Cette observation montre que ces deux formes 
replicatives recomhinantes contiennent un insert qui correspond a un 
fragment interne au gene de structure de la SUMT de Methanobacterium 
ivanovii. La forme replicative portant ce fragment interne au gene de 
structure de M. ivanovii est appelee pGIO^ 

20 6(B). 2. 2. Clonage du.gene de s^^cture de l.a SUMT de Methanobacterium 
ivanovii . ^ ‘ 

L'ADN genomique de Methanobacterium ivanovii est digere par 
plusieurs enzymes de restriction (digestions simples ou doubles) . Apres 
digestion, les fragment sont separes par electrophorese sur gel 
23 d' agarose, puis ils sont transf^res sup une membrane de nylon comme cela 
est decrit precedemment . Ap^s denatupation des fragments ainsi 
transferee et pr^ybridation, on procede k une hybridation avec la forme 
replicative pGIO comme sonde marquee au 32P comme cela est decrit 
precedemment. Il est ainsi trmjye qu'un fragment issu d'une digestion 
30 EcoRI -Bglll de 3.2 kb de Me^ano|>acterium ivanovii hybride avec la sonde 
(voir Figure 50). 40 |jg d'iw|) genomique d^e M. ivanovii sont ensuite 
digeres par EcoRI et Bglll puis separes' E>ar migration sur gel d' agarose. 
Les fragments ayant une taiile comprise entre 3 et 3.5 kb sont 
electroelues comme cela est decr.it precedemment. Les fragments ainsi 
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piarifies sont mis a ligaturer avec le vecteur pBKS-^ (Stratagene Cloning 
Systems, La Jolla) dig&ce par BamHI-EcoRI. La ligature est transformee 
dans E. coli DH5a (Gibco BRL) . Les transformants sont selectionnes sur 
milieu LB supplemente avec de I'ampicilline et du X-gal. 800 colonies 
^ blanches sont repiquees sur filtre; apres croissance puis lyse des 
bacteries on proc^e a une hybridation sur colonies selon la technique 
de Griinstein et Hogness (1975). La sonde . utlisee est la forme 
replicative pGIO marquee au 32P. Un seul clone positif apres ce test 
d'hybridation avec la sonde est trouve. L'ADN plasmidique de ce clone 
10 est appele pXLl609 (voir figure 56). Une digestion de cet ADN par 
EcoRI-Xbal permet de visualiser, comme attendu, un insert de 3.2 kb. Le 
plasmide pXL1809 est sequence sur les 2 brins par la technique de Chen 
et Seeburg (1985). Une sequence de 955 bases est obtenue (figure 51). 
Une analyse des phases ouvertes nous conduit a identifier une phase 
15 ouverte de la base 34 (ATG) a la base 729 (TGA), Cette phase ouverte 
code pour une proteine dont la sequence est presentee sur la figure 52. 
Cette proteine a un poids moleculaire de 24 900 (voir figure 53) ce qui 
est proche du poids moleculaire de la proteine purifiee a partir de M. 
ivanovii. La sequence NH2-terminale de cette proteine est exactement 
20 celle determines pour la SUMT de M. ivanovii purifiee (voir figure 48 et 
figure 52). Ces observations etablissent sans ambiguite que le gene 
clone et sequence est bien le gene de structure de la SUMT de M. 
ivanovii. Comme cette activite est supposes intervenir dans la 
biosynthese des corrinoxdes chez toutes les bacteries, ce gene est 
25 designs par gene corA et la proteine codes par ce meme g^e proteine 
CORA. Le profil d'hydrophobicite de la proteine CORA de M. ivanovii, 
realise a partir du programme de Hopp et Woods (1981) montre qu'il 
s'agit, comme cela est attendu, d'une proteine hydrophile, comme cela 
est presents sur la figure 54. La proteine CORA de M. ivanovii montre un 
30 degre d'homologie stricte de plus de 40 % vis a vis de COBA de P. 
denitrificans (figure 53). Cette homologie s'etend sur presque la 
totalite des deux proteines puisqu'elle conceme les residus 3 a 227 de 
CORA de M. ivanovii et les residus 17 a 251 de COBA de P. denitrificans. 
Cette homologie reflete les homologies structurales qu'il existe entre 
35 deux proteines catalysant la mime reaction. Ce sont les mimes regions 
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qui sont les plus conservees entre CORA et COBA de P. deni trif leans que 
celle qui sont conservees entire COBA de P. denitrif leans et CYSG d'E. 
coli (figures 22). 



EXEHPLE 7 - Expression de proteines COB 

7«1 - Expression c^ez Pseudomonas denitrificans 
3 Cet example illustre que 1' amplification d'un gene de 

structure d'une proteine COB de Pseudomonas denitrificans chez 
Pseudomonas denitrificans conduit a 1' amplification de I'activite de 
la proteine COB. 

7.1.1 - Expression de la proteine COBA 
10 Le plasmide pXL557 correspond au plasmide pXL59 dans 

lequel le fragment Bal ll- EcoR V ( respect iveraent aux positions 80 et 
2394 sur la sequence de la figure 7) de 2,4 kb du fragment de 5,4 kb a 
ete clone. Ce fragment cont lent les genes cobA et cobE . 

Le plasmide pXL545 contient uniquement le gene cobE . Sa 
15 construction a ete decrite dans 1' example 4. 1 . 

Ces deux plasmides ont ete introduits par transfert 
conjugatif chez SC510 Rif^. Les souches SC510 Rif'', SC510 Rif** pXL59, 
SC510 Rif'' pXL557 et SC510 Rif^ pXL545 ont ete cultivees en milieu 
PS4. A 4 jours, les culture ont ete arretees et les activites SUMT 
20 ont ete dosees suivant un protocole standard deja decrit (F. Blanche 
et al . , 1989). Les activites sont portees ci-dessous. 

Tableau : Activite SUMT de SC510 Rif'' et de quelques unes de ses 
derivees 
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II ressort clairement de ces resultats que seul le 
plasmide pXL557 entraine chez SC510 Rif*^ une nette augmentation de 
10 I'activite SUMT (un facte\ir 50). Cette augementation resulte de 
1' amplification de cobA et non de cobE puisgue le plasmide pXL545, gui 
ne permet que 1' amplification de cobE > ne provoque pas d' augmentation 
d'activite SUMT. Ce resultat confirme gue? cobA est le g&ie de 
structure de la SUMT de Pseudomonas denitrif icans . Ce resultat montre 
15 que I'on peut obtenir une amplification de I'activite SUMT chez 
Pseudomonas denitrif icans par amplification du gene de structure de la 
SUMT de Pseudomonas denitrif icans . 

7.1.2 - Expression de la proteine GOBI 

Un fragment provenant du fragment d'ADN de 8,7 kb, 
*20 contenant le gene de structure de la SP 2 MT (cobi), est clone sur un 
plasmide a large spectre d'hote chez les bacteries gram-negatives, 
puis ce plasmide est ensuite introduit par conjugaison chez 
Pseudomonas denitrif icans SC510 Rif*'. L'activite S-adenosyl-L-methio- 
nine:precorrine-2 methyltransf erase de la souche est ensuite mesuree 
25 par rapport a celle de la souche portant le vecteur. 

Le fragment BamH I- BamH I- Sstl - SstI de 1,9 kb contenant les 
genes cobH et cobI est purifie a partir du fragment de 8,7 kb. Des 
"linkers" Xba l et EcoR I sont places respectivement aux extremites 
Bam HI et Sst i apres gue celles-ci aient ete remplies avec I'ADN 
30 polymerase du bacteriophage T4. Le fragment est ensuite insere entre 
les sites Xba l et EcoR I du plasmide a large spectre d'hSte pXL59. II 
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porte la resistance a la kanamycine. Le plasjnide ainsi obtenu est 
nomine le pXLl146 (figfure 24). 

Par ailleurs un plasmide voisin a ete construit : le 
fragment BamHI- BamH l- Sstl de 1,5 kb contenant seulement le gene cobH 
5 en entier et la partie 5.' du gene cobi a ete purifie a partir du 
fragment de 8,7 kb. Des "linkers” Xba l et EcoRl ont ete ajoutes aux 
sites BamH I et Sst I respectivement apres que ceux-ci aient ete remplis 
ou digeres avec I'ADN polymerase du phage T4. Ce fragment a ensuite 
ete insere entire les sites EcoRI et Xba l du pXL59 pour donner le 

10 plasmide pXL1149. Les plasmides pXL1148 ,et pXL1149 ne different que 
par la presence sur pXLIUS du fragment Sstl-Ssti de 0,3 kb qui 
contient 1 ' extremite 3 ' du gene cobl . pXL1148 possede le gene de 
structure entier de cobl au dontraire de pXL1149. Les deux plasmides 
contiennent le g^e cobH . 

■15 Ces deux plasmides ont ete introduits par conjugaison chez 

SC510 Rif*". Les SOUChes SC^IO Rif -SCSI 0 Rif^ pXL59, SC510 Rif*" 
pXL1148 et SC510 Rif*" pXLl149 sont cultivees en milieu PS4. Apres 4 
jours de culture, les cellules sont recoltees et les activites SP 2 MT 
sont dosees comme cela est decrit dans 1' example 6.1.3 a). 

20 Le resultat de dosages est porte ci-dessous avec les 

activites de SP 2 MT definies comme a I'exemple 6.1.3 a). 
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^poiar 500 pg d' extrait brut introduit dans le test. 



L'activite est exprimee en % comme cela'est defini a 
I'exemple 6.1.3 a). 

Seul le plasmide pXL1148 apporte me augmentation sensible 
5 de I'activite SP 2 MT. Au contraire le plasmide pXL1149 ne donne pas de 
resultats differents de ceux observes avec les controles SC510 Rif^ et 
SC510 Rif'^ pXL59. Le pXL1148 est le seul plasmide a contenir le gene 
cobi et il est le seul a amplifier I'activite SP 2 MT; ce resultat 
confirms que le gene de structure de la SP 2 MT de Pseudomonas 
10 denitrificans est le gene cobl . De pl\is, si les proteines to tales de 
ces differentes souches sont separees par electrophorese en conditions 
denatiirantes (PAGE-SDS a 10 % d' acrylamide) on observe specif iquement 
dans le cas du pXLl148 la presence d'une batide gui correspond a une 
proteins ayant un poids moleculaire de 25 000 environ (figure 25). Le 
15 poids moleculaire de cette proteine correspond a celui de la proteine 
COBI. Le plasmide pXL1148 permet d'obtenir chez Pseudomonas 
deni tr i f icans la surproduction de la proteine COBI. 

7.1.3 ~ Expression de COBF 

L' expression est obtenue en positionnant en amont du gene 
20 cobF le promotexir P trp de E.coli et le site de fixation des ribosomes 
du gme cll du bacteriophage lambda. L' expression ainsi obtenue est 
beaucoup plus elevee que celle observes par simple amplification 
genic[ue grace au mime plasmide multicopie. 

Le fragment EcpRI-BamHI-BamHI de 2 kb environ du pXL1496 
25 (exemple 7.2.1) est purifie (figure 26). Ce fragment contient le 

promoteur Ptrp de E.coli et le site de fixation des ribosomes du gene 
cl I du bacteriophage lambda en amont du gene cobF . En aval du gene 
cobF se trouve le terminatetir de I'operon rmB de E.coli . Ce fragment 
est clone aux sites EcpRI-BamHI du plasmide pKT230 pour donner le 
30 pXLl546 (figure 26). Le pKT230 est un plasmide du groupe 

d' incompatibilite Q qui se replique chez presque toutes les bacteries 
gram-negatives (Bagdasarian et ^./ 1981); ce plasmide porte la 

resistance a la kanainycine. Le plasmide pXL1546 et pKT230 sont 
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introduits, par conjugaison, chez SC510 Rif*‘. Les souches SC510 Rif, 
SC510 Rif*^ pKT230 et SC510 pXL1546 sbnt cultivees en milieu PS4 

comme cela est decrit precedemmeht . Apres quatre jours de culture, les 
proteines totales des differMtes souches ^'ont analysees en PAGE-SDS a 
5 10 %. Comme cela est mphtre a la figure 27, on observe dans I'extrait 

de SC510 Rif'' pXL1546 une protSine d'uh poids moleculaire de 32 000 
environ qui est surexpfimee; cette proteine co-migre avec la proteine 
qui est siurexprimee par E.coii B pXLl496 (example 7.2.1). De plus 
cette proteine est spdcifiqu^ent exprimee dans la souche SC510 Rif' 
10 contenaint le pXLl 546 ou elle represente au 'moins 20 % des proteines 
totales. Par centre on n' observe pas cette proteine dans les proteines 
totales des souches SC510 Rif' et SC510 Rif' pKT230. Cette proteine 
surexprimee est done la proteine COBF. 

7.1.4 - Expression de COBH 

15 Cet example' decrit 1' amplification d'un fragment d'ADN de 

Pseudomoas denitrificans contenant le gene cobH . La proteine qui est 
codes par ce gene est purifies; il s'agit de la proteine COBH. Le 
plasmids pXL1149, decrit a i'exemple 7.1.2, ne contient sur 1' insert 
d'ADN provenant du fragment de 8,7 kb que le gene cobH en entier. Chez 
20 SC510 Rif', ce plasmide^ epntrairement- au vecteur, entrains la 

surexpression d' une proteine de poids moleculaire 22- 000 (figure 25). 

7.1.5 - Expression de COBV 

Cet example decrit 1' amplification de I'activite cobalamin 
(5' -phosphate) synthase par un plasmide ne portant que cobV (pXL699, 
25 voir figure 38) L'activiter;j cobalafairi ( 5 ' -phosphate ) synthase est 

amplifies chez SC877Rifr pa? ' le plasmide pXL699 d'uh facteur 50 par 
rapport d la meme souche av^ ie vecteur pXL435, pXL1303, pXLl324 ou 
pKT230. Ce plasmide ne ebntii^t'^sur s6n insert que cobV en entier plus 
les parties 5' terminales d'0RF18 et iide robu. 11 est certain .que dans 
30 une telle souche (SC877Rifr p)a,699) la^prpteine COBV est stirexprimee; 
cette siirexpressiort est d'un facteur. 50 par rapport a 1' expression de 
la souche SC877Rifr. 
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7.1 . 6. Expression de la proteine CORA 

he fragment EcoRI-BamHI-BamHI de 1.5 kb du pXL1832 (voir 
exemple 7.2.4} contenant le promoteur Ptrp puis le RBS cXi du 
bacteriophage X, le g^e de structure de la SUMT de M. ivanovii et la 
5 region terminatrice de I'operon rmB de E. coli est clone aux sites 
EcoRI-BamHI du pKT230 (Bagdasarian et al., 1981). De cette maniere, le 
plasmide pXL1841 est obtenu (voir figure 56). Ce plasmide est mobilise 
chez P. denitrificans SC510 Rifr comme cela est decrit precedemment . Un 
transconjugant est etudie plus en detail. Cette souche est cultivee en 
10 milieu PS4 et I'activite SUMT des extraits bacteriens est dosee en meme 
temps que celle de la souche controle SC510 Rifr pXL435 (Cameron et al., 
1989). Les activites de ces souches sont presentees ci-dessous. 

Souche Activite specifique SUMT 

en pmol/h/mg de proteines 

15 SC510 RifrpXL435 50-100 

SC510 RifrpXLl841 1700 

Ce resultat montre clairement qu'il y a expression de 1' activite SUMT de 
M. ivanovii chez P. denitrificans grace au plasmide pXL1841 puisgue 
1' activite SUMT de la souche SC510 Rifr pXLl841 est nettement superieure 
20 a celle de SC510 Rifr pXL435. 

7,2 - Expression chez E.coli 

Cet exemple illustre comment une proteine COB de 
Pseudomonas denitrificans peut etre surproduite chez E.coli . 

7.2.1 • Expression de COBF 

25 La surproduction est obtenue en positionnant en amont du 

gene cob le promoteur Ptrp de E.coli et le site de fixation des 
ribosomes du g^e cll du bacteriophage lambda. Le fragment EcoR I- Xho I 
de 2250 pb du fragment EcoR I de 8,7 kb (aux positions respectives 0 et 
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2250 sur la sequence presaitee a la figure 8) a ete clone dans le 
phage Ml3mp19 (Norrander et al., 1983) efttre les sites EcoRl et Sail. 
Le plasmide ainsi construit est nomine pXL1405. Un site Nde l a ete 
introduit par mutagenese dirigee de maniere a ce que les trois 
5 demieres bases (ATG) de ce site de restriction constituent le site 
d' initiation de traduction du g^e cobF . Cela revient a modifier les 
trois bases qui precedent I'ATG du gene cobF GAA (le G est a la 
position 733 sur la sequence presentee sur la figwre 8) en CAT. Le 
fragment Nde l- Sph l- Sph I (figure 26) nontenant le gene cobF est ensuite 
10 purifie; ce fragment de 1,5 kb est ensuite clone entre les sites 

du plasmide pXL694 (Denefle et al., 1987). Le plasmide ainsi 
construit est nomme pXLI 496 (figure 26). Sur le fragment EcoRl-Ndel de 
120 pb (qui provient du pXL694) qui precede le g^e cobF sont presents 
des signaux de regulation de 1 ' expression genetique de E.coli . Ces 
15 signaux sont constitues par la region [-40+1] du promoteur P trp de 
E_,.c_oli , puis par 73 pb qui contiennent le site de fixation des 

ribosomes du gene gH du barteriophage X (Denefle et gl., 1987). En 
aval du gene cobF se trouvent les tern^inateurs de I'operon rmB de 
E-coli (sur le fragment Hind lll-BamHin . Le plasmide pXLl496 a ete 
20 introduit par transformation dans la souche de E.coli (Monod et 

Wollman, 1947). L' expression. du gene cobF a ete etudiee comme cela est 
deja dScrit (Denefle et al., 1987) dans des conditions ou le promoteur 
PiEE est soit reprime (pre^ce de tryptophane), soit non reprime 
(absence de tryptophane). Le milieu ou I'expression a ete realisee est 
25 du milieu minimum M9 (Miller, 1972) supplements par 0,4 % de glucose, 
0,4 % de casaminoacides, 10 ’mM thiamine et 40 pg/ml de tryptophane 
dans le cas ou I'on veut reprimer le promoteur Ptrp . La souche E.coli 
B PXL1496 a ete cultivee a37*C dans le milieu decrit ci-dessus avec 
100 pg d'ampicilline. Comme il est montre sur la figure 28, I'absence 
30 de tryptophane entrains 1 ' expression d'une proteine d'un poids 

moleculaire de 32 000. En effet dans 1 ' extrait de proteines totales de 
E.coli B pXLI 496 analyse en PAGE-SDS (^gure 28) on observe clairement 
une proteine d'un poids moleculaire de 32 . 000 qui represente entre 1 
et 4 % des proteines totales ; tette proteine est- presente en quantites 
35 nettement moins importantes i^ns 1 ' extrait des proteines totales de 
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E.coli B pXLl496 cultivee dans les memes conditions, mais en presence 
de tryptophane. Le poids moleculaire de la proteine qui est exprimee 
dans ces conditions est proche du poids moleculaire de la proteine 
COBF deduit de la. sequence en acides amines de la proteine qui est 28 
5 927 (figure 16). La proteine qui est ainsi exprimee chez E.coli est la 

proteine COBF. 

7.2.2 - Expression de COST 

La surproduction est obtenue en fusionnant a I'extremite 
5' du gene cob le promoteur lac et les trois premiers codons de lacZ 
10 de E.coli. • 

Le site EcoRI situe a la position 2624 sur la sequence presentee sur 
la figure 32 du fragment de 4.8 kb contient le quatrieme Codon du gene 
cobT. Le fragment EcoRI-Xbal de 3,5 kb du pXL837 (voir figure 36) est 
clone aux sites EcoRl et Xbal du pTZ18R ou pTZl9R (Pharmacia) pour 
13 generer les pXL1874 ou pXL1875 respect! vement ; ces deux plasmides 
different par 1 ' orientation du gene cobT tronque vis a vis du 
promoteur de I'operon lactose d'E. coli (Plac). Plac est en amont de 
cobT sur pXLl874 tandis que c'est le contraire sur le pXL1875. Le 
clonage aux sites EcoRI-Xbal du pTZ18R du fragment EcoRI-Xbal du 
20 pXL837 permet de realiser une fusion de proteine entre les 4 premiers 
acides amines de la ^-galactosidase d'E. coli et le g^e cobT a 
partir de son 4eme codon. L' expression de ce gene lacZ' 'cobT est sous 
le controle des signaux d' expression de lacZ. Les plasmides pXLl874, 
PXL1875, pTZIBR sont introduits par transformation dans la souche de 
23 E.coli BL21 . L' expression du gene cobT est etudie comme cela est deja 
decrit (Maniatis et al., 1989). 

Comme le montre la figure 42B, vne proteine d'un poids moleculaire de 
72 000 n'est exprimee qu'avec le pXL1874 et represente, dans 1' extrait 
de proteines totales de BL21,pXL1874 analyse en PAGE-SDS, 1 a 4 % des 
30 proteines totales. Le poids moleculaire de la proteine qui est 
exprimee dans ces conditions est proche du poids moleculaire de la 
proteine COBT deduit de la sequence en acides amines qui est de 70 335 
sur la figure 40. Cette experience montre clairement qu'a partir du 
site EcoRI situe sur le quatrieme codon du gene cobT une phase ouverte 
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compatible avec celle trouvee pour le g&ie cobT.peut etre exprimee. 



10 



15 



20 



25 



7.2.3 - Expression d'une oroteine COBS tronouee . 

Un site BamHl est situe au niveau du 45eme codon du gene 
COBS. Le fragment BamHI-BamHI de 1.2 kb contenant la partie 3' du gene 
cobs et des sequences en aval de ce g&ie est excise du pXL843 pour 
etre clone au site BamHl du plasmide , pET-3b (Rosenberg et al., 1987) 
pour generer le pXL1937. Le fragment BamHl est oriente de maniere a ce 
que la partie t'ronquee du gene cobs soit fusionnee, en phase, avec les 
12 premiers codons de la proteine majeure de capside du bacteriophage 
T7 ou grae 10 (Rosenberg et al., -1987).- Ce gene hybride est sous le 
controls du promoteur 4>10 du bacteriophage T7. Le plasmide pXL1937 
ainsi que le pET-3b sont inbroduits par transformation dans la E, coli 
BL21 pLysS (W. Studier, communication personnelle) . Apres reisolement 
sur milieu selectif, les 2 souches sont cultivees en milieu liquide L 
jusqu'a une DO 610 nm de 1;- a ce stade la le milieu est a juste a une 
concentration en IPTG (isopropyl 8-galactoside) de 1 mM afin d'induire 
1' expression de la polymerase du bateriophage T7 (Rosenberg et al., 
1987). La culture est ensuite incubee 3 h a 37 *C, puis des lysats 
bact4riens sont prepcures. Les proteines totales des bacteries ainsi 
cultivees sont separees par PAGE en conditions denaturantes . Comme on 
le voit sur la figure 42A, il y a specifiquement surexpression d'une 
proteine de 33 000 avec la culture BL21 pLysS pXL1937. Ce poids 
moleculaire est tout a fait compatible avec le poids moleculaire 
attendu pour la proteine fusion (33 kD^. Cette experience montre 
clairement qu'a partir du site BamHl situe au niveau du 45eme codon du 
grae cobs, une phase ouverte: compatible avec celle trouvee pour le 
gene cobS peut etre surexpriii^e . 



7.2. 4 ; Expression de la proteine CQtiA 



Les oligonucl4otides ' suivants ont ete synthetises comme cela est 
30 decrit precedemment : . 



oligonucleotide 1277 
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5' GGC CGA ATT CAT ATG GTA GTT TAT TTA 3^ 

— 2 3 4 5 (1 a 5, 5 



EcoRI premiers codons 

Ndel de la SUMT de M.ivanovii) 



5 oligonucleotide 1278 

5' GGC CGA GCT CTA TTA CAT AAT T 



SstI 

(= sequence figurant sur la figure 51, positions 926 a 915 sur le brin 
10 complementaire du brin codant) 

L' oligonucleotide 1277 possede les sequences de reconnaissance des 
enzymes de restriction EcoRI et Ndel. Les trois dernieres bases du site 
Ndel (ATG), qui correspondent a un codon d' initiation de traduction, 
sont directement suivies par les codons 2 a 5 du gene de structure de la 
15 SUMT de M. ivanovii tels qu'ils figurent dans la sequence presentee sur 
la figure 52. L' oligonucleotide 1278 contient la sequence de 

reconnaissance de SstI, suivie directement de la sequence TATTACATAATT 
qui correspond a une sequence presente sur le fragment de 955 pb 
contenant le g^e corA presente sur la figure 51; cette sequence se 
20 trouve a la position 926 a 915 (voir figure 51) sur le brin 
complementaire du brin codant pour la proteine CORA. Les deux 
oligonucleotides 1277 et 1278 contiennent done dans leur partie 3' des 
sequences correspondent respect ivement au brin codant du gene cor A et au 
brin complementaire en aval de ce gene, Ces deux oligonucleotides 
25 peuvent etre utilises pour realiser une experience d' amplification 
enzym-atique avec le plasmide pXLl809 comme raatrice. Cette experience 
permet d'obtenir un fragment de 910 pb contenant le gene cor A de M. 
ivanovii possedant un site Ndel au niveau de I'ATG du gene corA et un 
site SstI a 1' autre extremite du fragment apres la fin du gene corA. 
30 L' amplification enzymatique est realisee comme precedemment decrit pour 
1' amplification enzymatique faite sur I'ADN genomique de M. ivanovii, si 
ce n'est que la matrice est constituee par 19 -ng d'ADN du plasmide 
pXL1809; les temperat\ires utilisees sont les m&nes, mais seulement 20 
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cycles d' amplification sont rialisSs . Conune cela est precedemment 
decrit, les produits d'^plification sont digeres par Ndel et Ssti avant 
d'etre separes par migration snr gel d' agarose. Conune attendu, un 
fragment d'une taille 910 pb ^t effectivement visualise. Ce fragment 
5 est purifie comme ceia est deji decrit. Ce fragment est clone aux sites 
Ndel et SstI du pXL694 (Denefle el al., 1987). Le plasmide resultant 
norome pXLl832 est decrit sur la figure 56. ‘Sur ce plasmide de la meme 
maniere que cela est decrit a 1' example 7.2, le g&ie de struture de la 
SUMT de M. ivanovii est precede par le site de fixation des ribosomes du 
10 gene cll du bacteuriophage X. lai amont de ce RBS se trouve le promoteur 
Ptrp. Le plasmide pXLl832 est introduit dans E. coli 65548 gui est une 
souche de E. coli portant la mutation cysG44 (Cossart et Sanzey, 1982) 
par transformation. Les activites- SUMT d^s souches E. coli B5548 pUC13 
et E. coli 65548 pXL1832 sont^'^oSees stir des extra! ts obtenus a partir 

15 de cellules cultivees en miliiu-Lp supplSmentil en ampicilline. Le dosage 

■ ■ ■ 

de I'activite SUMT est realia^ comme cela a deja ete decrit (Blanche et 
al., 1989). Les resultats de ce dosage sbht dbnhes ci-dessous. 

Souche Activite specif ique SUMT 

en pmbl/h/mg de protelnes 

s’ . ■ 

20 E. coliB5548 pUC13 5.9 ‘ 

E. coli 65548 pXLI 832 31 (j" ' 

Les resultats presentes sur le tableau ‘Ci-dessus montrent clairement 
qu'il y a expression d'une adtivite SUM^ chez la souche E. coli B5548 
lorsgue celle-ci contient une plasmide pXL1B32 'gtii exprime la SUMT de M. 
23 ivanovii. La SUMT de M. ivanovii peut done etire exprimee chez E. coli. 

EXEHPLE 8 - Amplification de la production de cobalamines par les 
techniques d'ADN recombincuit 

8.1 - Amplification chez P . deni trif leans 
Get exeiiiple illustre comiiieiit une amelioration de la 
30 production de cobalamines est obtenue"' chsz Pseudomonas denitrificans 
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SC510 Rif*" par amplification <3e genes cob de Pseudomonas denitrificans 
SC510. 



8.1.1 Amelioration de la production de cobalamines chez 
Pseudomonas denitrificans par levee d'une etape limitante dans la 

3 biosynthese des cobalamines 

Cet exemple illustre comment la productivite en 

cobalamines de souches de Pseudomonas denitrificans peut etre 
amelioree par amplification de genes cob de Pseudomonas denitrificans . 
Cette amelioration resulte de la levee d'une etape limitante de la 
10 voie de biosynthese. 

Le plasmide pXL367 est decrit a 1 ' exemple 4.2 ( figure 13). 
Ce plasmide correspond au pRK290 (Ditta et al., 1981) dans lequel le 
fragment EcoR I de 8,7 lib a ete insere. Ce plasmide pXL367 procure une 
amelioration de la biosynthese de cobalamines chez la souche SC510 
15 Rif*". Les souches SC510 Rif^, SC510 Rif*" pRK290 et SC510 Rif*" pXL367 
sont cultivees en erlenmeyer dans du milieu PS4 suivant les conditions 
decrites dans les protocoles experimentaiix . On observe une 
amelioration du titre de production due a la presence du plasmide 
pXL367. En effet la souche SC510 Rif'’ pXL367 produit 30 % de plus de 
20 cobalamines que les souches SC510 Rif'’ et SC510 Rif'’ pRK290. Cette 
amelioration n'est pas due a 1' amplification de n'importe quels g^es 
de Pseudomonas denitrificans mais a 1' amplification specif ique de 
g«ies portes par le fragment EcoR I de 8,7 kb. En effet le plasmide 
pXL723 decrit sur la figure 11 ne donne aucune amelioration et le meme 
25 titre de production est observe avec ce plasmide qu'avec les souches 
SC510 Rif et SC510 Rif'" pRK290. 

8.1.2 Amelioration de la production de coenzyme chez 
Pseudomonas denitrificans par levee de deux etapes limitantes dans la 
biosynthese des cobalamines 

30 Cet exemple illustre comment la productivite en 

cobalamines de souches de Pseudomonas denitrificans peut etre 
amelioree par amplification de genes cob de Pseudomonas denitrificans . 
Cette amelioration rSsulte de la levee de deux etapes limitantes de la 
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voie de biosynthese. 

Le fragment Clal-EcoRV de 2,4 kb issu du fragment de 
5,4 kb (contenant les graes cobA et cobE ) est coclone avec le fragment 
EcoRI de 8,7 kb sur ie plasmide a large spectre d'hote pXL203. Le 

plasmide ainsi constrtiit est appele pXL525 (figure 29). Ce plasmide 

! 

est introduit chez SC510 Riff peif cohjugaison. La souche SC510 Rif*" 
pXL525 produit 20 % de cobalamines de plus gue SC510 Rif pXL367. 
L'amplification des genes cobA et cobE permet de lever une nouvelle 
etape limitante chez SC510 Rif*' dans la biosynthese des cobalamines. 
La souche SC510 Rif*' de Pseudomonas denitrif leans est amelioree 
le present exemple par la levee successive de deux etapes limitantes. 
Cet exemple montre que la J^yee de deux etapes limitantes dans la 
biosynthese des cobalamines peut conduire a des ameliorations 
supplements ires de production J - 



15 



20 



25 



30 



8.2 - Am^ioration de la; productivite de cobalamines chez 

AqrobacteT-iiim tnimof ain-j tme 

Cet exemple illdstre 1' amelioration de la production de 
cobalamines d'une souche productrice de cobalamines par 
l'amplification de genes cob de Pseudomonas denitrif ifrana SC510, 

La souche utilises est une souche de bacterie 
gram-negative ; il s'agit d'une souche d' Aorobaeterium tumef aciens . 

Les plasmi^es d4crits. dans les examples 4.2 et 8.1, pXL367 
et pXL525 ainsi que le vecfeur pRK29Q (Ditta et al., 1981) et le 
plasmide pXL368 (figtu:e 29), sent introduits par transfert conjugatif 
chez la souche d' Aqrobacterium tumef aciens C58-C9 Rif*" (Cameron et 
al., 1989). Les souches C58-C9 Rif *■, ,C58-C9 Rif *■ pRK290, C58-C9 Rif 
PXL367, C58-C9 Rif^ pXL368 et G58-C9 Rif*" pXL525 sqnt cultivees en 
milieu PS4 k 30 ’C cpiiime cela est decrit precedemment. Les cobalamines 
produites sont dosees comme cela est decrit ppecedemment . Les titres 
de productions sont port§s sur le tableau ci-dessous. 



Tableau : Titres de vitam^i^_ Pi 2 prodiiite par differentes souches 
d ' Agrobacterium tumefaciens ' ^^combinantes . 
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Souche 


Vitamine 
en mg/1 


C58-C9 Rlf^ 


0.4 


C58-C9 Rif pRK290 


0.4 


C58-C9 Rif*" pXL367 


0.8 


C58-C9 Rif pXL368 


0.8 


C58-C9 Rif*' pXL525 


1.2 



Comme il apparait clairement sur le tableau ci-dessus, la 
10 production de cobalamines est amelioree chez la souche d' Aarobacterium 
tumefaciens utilisee. Deux plasmides differents ameliorent la 
production de cobalamines de la souche d' Aorobacterium tumefaciens 
utilisee: pXL367 et pXL368. Ces plasmides contiennent respectivement 
le fragment EcoR I de 8,7 kb (graes cobF a cobM ) et le fragment 
15 Clal-EcpRV de 2,4 kb (gene cobE et cobA ) . Separement, ils ameliorent 
la production de cobalamines d^ Aorobacterium tumefaciens C58-C9 Rif^ 
d'un facteur 2; ce resultat montre qu'il est possible d'ameliorer la 
production de cobalamines d'une souche d^ Aarobacterium tumefaciens en 
amplifiant des fragments portant des genes cob de Pseudomonas 
20 denitrificans « Dans le cas present on peut parler d' amelioration 
heterologue, c'est-a-dire d' amelioration de la production de 
cobalamines d'une souche moyennant 1' amplification de g^es cob d'une 
autre souche. 

Les ameliorations de production de cobalamines apportees 
25 par les diff&rents fragments de Pseudomonas denitrif icans contenant 
des g^es cob sont curaulables, c'est-a-dire gu'en mettant sur le meme 
plasmide les deux fragments gui sont separement clones sur le pXL367 
et le pXL368, on observe des ameliorations: additives. Le plasmide 
pXL525 apporte chez Aorobacterium tumefaciens C58-C9 Rif'* une 
amelioration de production superieure a celle apportee par chacun des 
fragments clones separement sur le meme vecteur. 



30 
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8.3 - Amelioration de la product! vite de cobalamines chez 

RhiZObii ™ ma1-i1n«-i 

Cet example decrlt 1 'amelioration de la production de 
cobalamines d'une autre soiicbe productrice !^de cobalamines. 

5 Le plasmide decrit a 1' example 8.2, pXL368, ainsi que le 

vecteur pRK290 (Oitta. et al., 1981) sont introduits par transfert 
conjugatif chez la souche Rhizobium meliloti 102F34 Rif'" (Leong et 
al., 1982). Les transconjugarits : 102F34 Rif*', 1Q2F34 Rif^ pRK290 et 
102F34 Rif*^ pXL368 sont QUltives en milieu PS4 a 30 *C comme cela est 
•10 decrit precedemment . Les .cobalamines produites sont dosees conune cela 
est decrit precedemment. Les titres de productions sont portes sur le 
tableau ci-dessous. 

Tableau : Titres des cobalamines produites par differentes souches de 
Rhizobium meliloti recombinantes 

15 



20 



Comme il apparait clairepent sur le tableau ci-dessus, la 
production de cobalamihes est ameliorSe chez la souche de Rhizobium 
jneliloti u‘tilis66. Lg plssnildG pXL368 EitiGliorG 1 e production do 
cobalamines de la souche de Rhizobium. meliloti utilisee. Ce plasmide 
25 contient le fragment Clal-g^RV de 2, A Hb (g&ies cobA et cgbE) ; il 
ameliore la production de cobalamines de Rhizobium meliloti 102F34 
Rif*' d'un facteur 2, Ce resultat montre qu'il est possible d'ameliorer 
Is production de cobalamines d'une souche de Rhizobium meliloti en 
amplifiant des fragments portant des graes cob de Pseudomonas 
{^-^^^.brificans , Dans le cas present on peut parler d' amelioration 
heterologuG/ c'est-a-dire . d' amelioration de la production de 
cobalamines d'une soucihe moyennant 1' amplification de genes cob d'une 



Souche 


Vitamine 
en mg/1 


102F34 Rif*" 


0.4 


102F34 Rif*^ pRK290 


0.4 


102F34 Rif*' pXL368 


0.8 
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autre souche. 

EXEHPLE 9 - Dosage des corrinoxdes et des descobaltocorrinoxdes dans 
les mouts et les cellules de souches productrices de corrinoxdes 

Get exemple illustre comment il est possible d' identifier 
5 et de doser les differents corrinoxdes et descobaltocorrinoxdes 

produits par differentes souches productrices de cobalamines. Ce 

dosage permet entre autre de doser le coenzyme 612 . 

Les mouts (ou les cellules seules) sont cyanures comme 
cela a deja ete decrit (Renz, 1971). Apres centrifugation, une 

10 aliguote du sumageant est passee a travers une colonne de 

DEAE-Sephadex qui est ensuite lavee extensivement avec du 

dihydrogenophosphate de potassium IM. Les fractions recueillies sont 
regroupees et dessalees sur une cartouche Sep-Pak C-18 -(Waters). Apres 
evaporation et resuspension dans l^eau (100 [il a 1 ml suivant la 
15 quantite de corrinoxdes presents), les corrinoxdes sont identifies et 
doses par CLHP sur une colonne de Nucleosil C-18 (Macherey-Nagel) . La 
colonne est eluee a 1 ml/mn avec un gradient d^ acetonitrile (de 0 % a 
100 %) dans du tampon phosphate de potassium 0,1 M contenant 10 mM de 
KCN. 

20 Les corrinoxdes sont visualises en detection U.V. a 371 nm 

et/ou par la detection specif ique du ^^Co (si la culture a ete 
effectuee en presence de ^^CoCl 2 ) a I'aide d'un detecteur Berthold LB 
505. Ils sont done identifies et par comparaison de leur temps de 
retention avec des etalons. De meme, les descobaltocorrinoxdes (acide 
25 hydrogenobyrinique, acide hydrogenobyrinique monpamide et acide 
hydrogenobyrinique diamide) sont visualises en detection U.V. a 330 
nm. Par cette technique les intermediaires suivants sont separes: 
1 ' acide cobyrinique, 1 ' acide cobyrinique monoamide, 1 ' acide 
cobyrinique diamide, 1 ' acide cobyrinique triamide, 1 ' acide cobyrinique 
30 tetraamide, 1 ' acide cobyrinique pentaamide, 1 ' acide cobyrique, le 
cobinamide, le cobinamide phosphate, le GDP-cobinamide, la vitamine 
Bi 2 -*phosphate et la vitamine Bi 2 - Les formes adenosylees de ces 
produits sont aussi separees et dosees par cette technique. Pour ce 
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faire, i'etape initiale de eyanuration est / supprimee et la colonne 

* a.;,' 

CLHP est eluee avec du tampon depour;^ de KGN. Nous donnons a la 
figure 31 les temps de retention de differents etalons separes par ce 
systeme et identifie a la sortie de la colonne par absorbance U.V. 

Un echantillon de, la souche.BCSIO Rif® a ete depose le 30 
janvier 1990 au Centraal .. .Bureau voor Schimmelcultures a Baarn 
(Pays-Bas) ou il a ete enregiftre sous la reference CBS 103.90. 



5 
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REVENDICATIONS 



1. Sequence d'ADN caracterisee en ce qu'elle code pour un polypeptide 
implique dans la biosynthese des cobalamines et/ou des cobamides. 

2. Sequence d'ADN selon la revendication 1 caracterisee en ce qu'elle 
3 est choisie parmi 

. les genes cobA, cob B> cobC, cpbD, cpbE, cpbF, cob G, cobH . cpbl, 

cob J. cob K. cobL , cobM, cqbN, cobO . cobP, cobO , cpbS, cobT , cob U. 

cobV, cobW, cob x. cor A> presentes aux figures 15/ 16/ 40, 41 , 47 et 

52 / 

10 « les homologues de ces sequences resultant de la degenerescence du 

code genetique/ 

. les sequences d'origine naturelle/ synthetique ou recombinante, qui 
hybrident et/ou qui presentent des homologies significatives avec ces 
sequences d'ADN ou avec des fragments de celles-ci/ et qui codent pour 
13 des polypeptides impliques dans la biosynthese des cobalamines et/ou 
des cobamides. 

3. Gene contenant une sequence d'ADN selon l^\me des revendications 
precedentes. 

4. ADN recombinant caracterise en ce qu'il contient au moins une 

20 sequence d'ADN selon I'me des revendications 1 a 3. 

5 . ADN recombinant selon la revendication 4 caracterise en ce que 

lesdites sequences d'ADN sont placees sous le controls de signaux 
d' expression. 

6 . ADN recombinant selon la revendication 5 caracterise en ce que les 

25 signaux d' expression peuvent etre homologues ou heterologues de la 

sequence d ' ADN . 



7. ADN recombinant selon I'une des revendications 4 a 6 caracterise en 
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ce gu'il fait partie d'un pl^mide d'expression. 

8. Plasmide caracterise en ce qu'il contient au moins une sequence 
d'AON codant pour un polypeptide iiapligue dans la biosynthese des 
cobalamines et/ou des cobamides, et des sequences permettant leur 

^ expression. 

9. ' Plasmide selon la revendication 6 caracterise en ce qu'il contient 
. un ADN recombinant selon I'une des revendications 4 a 7, 

. un syst^e de replication, 

. au moins un marqueur de selection. 

10 10. Plasmide selon la revendication 8 caracterise en ce qu'il est 

choisi parmi 

. le plasmide pXL1500 contdnant les genes cobA . cobs . cob C et cob E. 

. les plasmides pXL723 et pXL302 contenant les genes cob C et cob D. 

. le plasmide pXLl 397 contenant les g^es cobB et cob C. 

15 . les plasmides pXL368 et pXL557 contenant les genes cob A et cpbE, 

. les plasmides pXL545 et pXL545 o contenant le g^ene cobE, 

• les plasmides pXL367 et gXIi253 contraant les genes cobF, cob G> cobH, 
cob l. cpbJ, cob K. cpbL, cobM ^ . 

. le plasmide pXLl148 contena:^ les genes cob H et cob l. 

20 . le plasmide pXL1 1 49 contenant le gene Cob H. 

. les plasmides pXL1496 et pXL1546 cont^ant le gene cob F. 

. le plasmide pXL525 cbnteiimt les g&ies cob A. cob E et cob F a cob M. le 
plasmide pXL843 contenant Ifes g^es cob Xi cob S. et cob T. le plasmide 
pXL699 contenant le qme c©bV . le plasmide pXL1324 contenant le gene 
23 cob U> les plasmides pXL618 et pXL623 contenant respectiveraent les 
genes cpbQ et cob P. le plasmide pXL593 contenant le g&ie cob P et cob W 
et le plasmide pXL1909 contiebant les genes cobP. cob W. cobN . et cobO. 

11. Cellule dans lac^elle a ete in^rgduite une sequence d'ADN selon 
I'lme des revendications 1 a 7 ou lan plasmide selon I'une des 

30 revendications 8 a 10. 

12. Polypeptide caracterise en ce qu'il est implique dans la 
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biosynthese des cobalamines et/ou des cobamides. 

13. Polypeptide selon la revendication 12 caracterise. en ce qu'il est 
code par une sequence d'ADN selon I'une des revendi cations 1 a 7. 

14. Polypeptide selon la revendication 12 caracterise en ce qu'il 
5 intervient dans la transformation du precorrine-3 en 5'-deoxy 

5'-adenosyl(Ado) acide cobyrinique a,c-diamide. 

15. Polypeptide selon la revendication 14 caracterise en ce qu'il 
contient tout ou partie des sequences peptidiques COBB, COBF, COBG, 
COBH, COBJ, COBK, COBL, COBH, COBN, COBO, COBS et COBT presentees aux 

10 figures 15, 16, 40 et 41. 

16. Polypeptide selon la revendication 14 caracterise en ce qu'il 

catalyse le transfert d'un groupement methyl aux positions Cl, C5, 
C11, Cl 5, ou Cl 7 intervenant- entre le precorrine-3 et 1' acide 
cobyrinique a,c-diamide. 

15 17. Polypeptide selon la revendication 16 caracterise en ce qu'il 

contient tout ou partie des sequences peptidiques COBF, COBJ, COBL et 
COBM presentees a la figure 16. 

18. Polypeptide selon la revendication 12 caracterise en ce qu'il 

intervient dans la transformation de 1' acide cobyrique en cobinamide. 

20 19. Polypeptide selon la revendication 18 caracterise en ce qu'il 

contient tout ou partie des sequences peptidiques COBC et COBD 
presentees a la figure 1 5 . 

20. Polypeptide selon la revendication 12 caracterise en ce qu'il 

possede une activite S-adenosyl-L-methionine:precorrine-2 methyl 

23 transferase (SP2MT) . 

21. Polypeptide selon la revendication 20 caracterise en ce qu'il 
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contient tout ou partie de la sequence peptidique GOBI presentee a la 
figure 16, 

22. Polypeptide selon la revendication 1 2 caracterise en ce qu'il 

possede une activite acide cobyrinique et/ou hydrog&iobyrinique 

5 a,c-diamide synthase. 

23. Polypeptide selon la revendication 22 caracterise en ce qu'il 

contient tout ou partie de la sequence peptidique COBB presentee a la 

figure 15, 

24. Polypeptide selon la revendication 12 caracterise en ce qu'.il 

10 possede une activite precorrih-Bx mutase. 

25. Polypeptide selon la revendication 24 caracterise en ce qu'il 

contient tout ou partie de la sequence peptidique COBH presentee a la 
figure 16. 

26. Polypeptide selon la revendication 12 caracterise en ce qu'il 

15 contient tout ou partie de la sequence peptidique COBE presentee a la 

figxire 15, 

27. Polypeptide selon la revendication 12 caracterise en ce qu'il 

poss^e une activite nicotinate-hucleotide : dimethylbenzimidazole 

phosphoribosyltransf erase . 

20 28. Polypeptide selon la rev^dicatioh 27 caracterise en ce qu'il 

contient tout ou partie de la'-sequehce peptidique COBU presentee a la 
figure 41 . 

29. Polypeptide selon la revendication 12 caracterise en ce qu'il 

possede xme activite cobalanline-( 5' -phosphate) synthase. 

25 30. Polypeptide selon la revendication 29 caracterise en ce qu'il 

contient tout ou partie -de la sequence pelptidique COBV presentee a la 
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figure 41 . 

31. Polypeptide selon la revendication 12 caracterise en ce qu'il 

posside une activite cobyric acid synthase. 

32. Polypeptide selon la revendication 31 caracterise en ce qu'il 

5 contient tout ou partie de la sequence peptidique COBQ presentee a la 

figure 47. 

33. Polypeptide .selon la revendication 12 caracterise en ce qu'il 

possede une activite cob(I)alainin adenosyltransf erase. 

34. Polypeptide selon la revendication 33 caracterise en ce qu'il 

10 contient tout ou partie de la sequence peptidique COBO presentee a la 

figure 47. 

35. Polypeptide selon la revendication 12 caracterise en ce qu'il 

possede une activite precorrin-6x reductase. 

36. Polypeptide selon la revendication 35 caracterise en ce qu'il 

15 contient tout ou partie de la sequence peptidique COBK presentee a la 

figure 16. 

37. Polypeptide selon la revendication 12 caracterise en ce qu'il 

intervient dans la transformation du cobinamide en GDP-cobinamide. 

38. Polypeptide selon la revendication 37 caracterise en ce qu'il 

20 possede une activite cobinamide kinase et cobinamide phosphate 

guanylyltransf erase . 

39. Polypeptide selon la revendication 38 caracterise en ce qu'il 

contient tout ou partie de la sequence peptidique COBP presentee a la 
figure 47 

25 40. Polypeptide selon la revendication 12 caracterise en ce qu'il 
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contient tout ou partie des sequences peptidiques COBS, COST et COBX 
presentees figiire 40. 

41. Polypeptide selon la xevehdication 13 caracterise en ce qu'il est 
choisi parmi les proteines COBA, CORA, COBB, COBC, COBD, COBE, COBF, 

5 COBG, COBH, COBI, COBJ, COBK, COBL, COBM, COBN, COBO, COBP, COBQ, 

COBS, COBT, COBU, COBV, COBW et COBX pr^entees aux figures 15, 16, 
40, 41, 47 et 52. 

42. Precede de production des polypeptides selon les revendications 12 
a 41 caracterise en ce que 

10 . on introduit dans une cellule hote une sequence d'ADN selon les 

revendications 1 a' 7, ou un plasmide selon les 
revendications 8 a 10 cohtenant une telle sequence, 

on cultive cette cellule ° rebombinante dans des conditions 
d' expression de ladite sequence, et 
15 . on recupere les polypeptM^: produits . 

43 . Precede selon la reyendil&atipn 4^ caracterise en ce que la cellule 
hote peut etre choisie paritii les procaryotes, les eucaryotes, les 
cellules animales ou vegetales. 

44. Precede selon la revendication 43 caracterise en ce que la cellule 
20 hote est une archaebacterie ou une eubaicterie. 

45. Proc^e selon la revehdicatibri 44 caracterise en ce que la cellule 
hote est E.coli . Pseudomohas denitrificans . Rhizobiutn melitoti . 
Aqrobacterium tumef aciens . ou Salmonella typhininriuni . 

46. Precede permettant d'augm^ter la {>ro^ction de cobalamines et/ou 
25 de cobamides ou de leurs prec^seurs catact4rise en ce que 

. on introduit dans un micrd^^^iat^ producteur de ces composes, ou 
potentiellement producteur'de ces composes, une'ou plusieurs sequences 
d'ADN codant pour un polypeptide implique dans ' la biosynthese des 
cobalamines et/ou des cobamides. 
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. on cultive le micrdorganisme ainsi obtenu dans des conditions de 
synthese des cobalamines et/ou des cobamides et d' expression de ladite 
sequence, 

« on recupere les cobalamines et/ou les cobamides ou leurs precurseiirs 
5 produits. 

47. Procede selon la revendication 46 caracterise en ce que I'on 
introduit dans le microorganisme une ou plusieurs 

sequences d'ADN selon I'une des revendications 4 a 7, ou un plasmide 
selon les revendications 8 a 10 contenant de telles sequences. 

10 48. Procede selon la revendication 47 caracterise en ce que la 

sequence d'ADN introduite dans le microorganisme code pour un 
polypeptide catalysant une etape limitante de la biosynthese des 
cobalamines et/ou des cobamides. 

49. Procede selon la revendication 47 caracterise en ce que les 

15 sequences d'ADN introduites dans le microorganisme codent pour des 

polypeptides catalysant des etapes limitantes de la biosynthese des 
cobalamines et/ou des cobamides. 

50. Procede selon l^une des revendications 46 a 49 caracterise en ce 
que le microorganisme est choisi parmi P, denitrificans . R. melitoti . 

20 A. tumefaciens . 

51. Procede selon la revendication 50 caracterise en ce que le 

microorganisme est P. denitrif leans . 

52. Procede selon la revendication 51 caracterise en ce que le 

microorganisme est P. denitrif leans SC510 RifR. 

23 53. Procede selon l^une des revendications 46 a 52 caracterise en ce 

que I'on introduit dans le microorganisme un plasmide selon la 
revendication 10. 
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54. Proc§de selon les rev^c^cations 46 i 53 ..caracterise en ce que 
I'on introduit dans la souche P. denitrif leans SC510 RifR le plasmide 
PXL525. 



55. Precede selon les revendications 46 a 54 caracterise en ce que les 

5 cobalamines et/ou les cobamides produits sent recuperes par 

. solubilisation, 

. conversion en forme cyano, et 
. purification. 

56. Precede selon les revendications 46 a 55 caracterise en ce que la 
10 cobalamine est le coenzyme B12. 

57. Precede selon les revendications 46 a 55 caracterise en ce que le 

precurseur est choisi parmi les descobaltocorrinoides et les 



corrinoides . 
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6GGCTGCAGG 7CGACTCTAG AATCGATGAA GCCTGCC^G AAGGCGGCGA CGAACAGGAA 
CCCGACGTCC AGCTGAGATC TTAGCTACTT CGGACGCTAC TTCCGCCGCT GCTTGTCCTT 

70 80 90 • . 100 110 120 
GGCGAGCAGG TGGAAGGCGA GATCTTGCAC GGCGGGGACT CGAGAGGAISA GCTGTCAGGC 
CCGCTCGTCC ACCTTCCGCT CTAGAACGTG CCGCCCCWa GCTCTCCTCT CGACAGTCCG 

130 140 150 *160 170 180 
GGGATTTTCC GCCTTGTGTC AGAGCCCGGC GCGATTfGCA AAGCCTTCTG TCGCGGTGTT 
CCCTAAAAGG CGGAACACAG TCTCO^CG CGCTAiiACGT TTCGGAAGAC AGCGCCACAA 

190 200 210 220 230 240 
GCTGTCCATG CAGGTGTCGA AATTGAAAAA CCGAGJiAAGA TTCAAAGCCT TGTTCCAGCT 
CGACAGGTAC GTCCACAGCT TTAACTTTTT GGCTGTTTCT AAGfTTCG^ ACAAGGTCGA 

250 260 270 280 290 300 
CGCTGTCTTT CTGGATGGAG GCGCTCTCGC CCGCATGGTG CCGAAGAAGG GCTGTCCTTG 
GCGACAGAAA GACCTACCTC CGCGAGAGCG GGCGTACCAC GGCTTCTTCC CGACAGGAAC 

310 320 330 340 350 360 
CGATACGGTA GGCGGATGAC GATCTTCCTC AAACGGGACA TGGCGATGGC GCAATCCGGT 
GCTATGCCAT CCGCCTACTG CTAGAAGGAG TTTGOSlinXjT ACGGCIACCG CGTTAGGCCA 

370 380 390 ^400 410 420 
TTGACCGGCC TTCCGCGCTC CGGTAAAAAT GAAGGATATG CGAC03CGTC CGCTTTGGCG 
AACTGGCCGG AAGGCGCGAG GCCATTTTTA CTTCCiATAC GCTGCCGCAG GCGAAAGCGC 

430 440 450 /^i460 470 480 
GACTGAAAGA 6CGTCCGGTG CGGCCGACCC AGTCA1SSGGG GCATCAGCCG GTGCTGTCCA 
CTGACTTTCT CGCAGGCCAC GCCGGCTGGG TCAGTCCCCC CGtAGTC(^ CACGACAGGT 

490 500 510 ' 520 . 530 540 
GATCGGCCGG GACGGATCGT CCCAGCCGGC GCTTCGTTAA GGAGAACAAC GAAGGGAGCC 
CTAGCCGGCC CTGCCTAGCA GGGTCGGCCG CGAAGOiVTT CCTCTTGTTG CTTCCCTCGG 

550 560 570 580 590 600 
GGCCGCCGAT GCCATCGGGC CAACACTCTG CACAGACGAC GAAAGCAGGA GCCGGGCTGG 
CCGGCGGCTA CGGTAGCCCG GTTGTGAGAC GTGTCTGCTG CTTTCGTCCT CGGCCCGACC 

610 620 630 '640 650 660 
TGCTCGGGCT CGGCTGCGAG CGTCGCACGC CGGCCGAAGA GGTGATCGCC CTTGCCGAGC 
ACGAGCCCGA GCCGACGCTC GCAGCGTGCG GCCGGCTTCT CCACTAGCGG GAACGGCTCG 

670 680 690 '700 710 720 
GTGCGCTTGC CGATGCCGGT GTTGCGCCCG GCGATCTGCG GCTGGTCGCC TCGCTCGATG 
CACGCGAACG GCTACGGCCA CAACGCGGGC CGCTAGACGC CGACCAGGGG AGCGAGCTAC 

730 740 750 ' 760 770 780 
CTCGCGCCGA GGAGCCGGCG ATCCTGGCGG CCGCmGCA Tl^GCGGTT CCGGCCGCGT 
GAGCGCGGCT CCTCGGCCGC TAGGACCGCC GGCG|^CG7 AAAGCGCCAA GGCCGGCGCA 

790 800 810 820 ■ B30 840 
TCTACGATGC CGCCACGCTC GAAGCCGAAG CTTCCCGGCT CGCCAACCCG TCCGAGATCG 
AGATGCTACG GCGGTGCGAG CTTCGGCCTC GAAGGGCCGA GCGGTTGGGC AGGCTCTAGC 

650 860 870 : ^ 880 . 890 900 
TCTTTGCCTA CACGGGTTGT CATGGCGTTG CCGAGGGTGC AGCGterCGTC GGCGCCGGTC 
AGAAACGGAT gtgcccaaca gtaccgcaac ggctcccacg tcgcgagcag ccgcggccag 

910 920 930 ■; 940 . 950 960 
GCGAAGCCGT GCTGATTGTG CAGAAGATCG TCTCCqk:CCA TGCGACGGCC GCACTTGCCG 
CGCTTCGGCA CGACTAACAC GTCTTCTAGC AGAGGC^T ACGCTGCCGG cgtgaacggc 
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970 980 990 

GGCCGGCGAC CTTGCGCGCC GAAAAGCGCA 
CCGGCCGCTG GAACGCGCGG CTTTTCGCGT 

1030 1040 1050 

TTATGTTGTT GAATTGAATC AATCTTTTGC 
AATACAACAA CTTAACTTAG TTAGAAAACG 

1090 1100 1110 
TTTAGAGAGC GCGTCAGGCG TGCCGTTGGG 
AAATCTCTCG CGCAGTCCGC ACGGCAACCC 

1150 1160 1170 

ATGATCGACG ACCTCTTTGC CGGATTGCCG 
TACTAGCTGC TGGAGAAACG GCCTAACGGC 

1210 1220 1230 

GGCGCCGGCC CCGGCGATCC CGGCCTGTTG 
CCGCGGCCGG GGCCGCTAGG GCCGGACAAC 

1270 1280 1290 

GCGGATGTGA TCGTGCATGA TGCGCTGGTC 
CGCCTACACT AGCACGTACT ACGCGACCAG 

1330 1340 1350 

GGCGCCGTGC TGGAGTTTGC GGGCAAGCGT 
CCGCGGCACG ACCTCAAACG CCCGTTCGCA 

1390 1400 1410 

ATCTCGCTTC GCCTCGTCGA ACTCGCGCGC 
TAGAGCGAAG CGGAGCAGCT TGAGCGCGCG 

1450 1460 1470 

GGCGATCCCT TCGTCTTCGG TCGCGGTGGC 
CCGCTAGGGA AGCAGAAGCC AGCGCCACCG 

1510 1520 1530 

GTGCCGTTCC GAATCGTGCC CGGCATCACC 
CACGGCAAGG CTTAGCACGG GCCGTAGTGG 

1570 1580 1590 

ATTCCCGTGA CCCATCGCGA GGTCAACCAC 
TAAGGGCACT GGGTAGCGCT CCAGTTGGTG 

1630 1640 1650 

TCCGGCCTGG TGCCGGATCG CATCAACTGG 
AGGCCGGACC ACGGCCTAGC GTAGTTGACC 

-1690 1700 1710 

GTCATGTACA TGGCGATGAA ACATATCGGC 
CAGTACATGT ACCGCTACTT TGTATAGCCG 

1750 1760 1770 

CGCTCGCCGG ACGAACCGGT CGCCTTCGTC 
GCGAGCGGCC TGCTTGGCCA GCGGAAGCAG 

1810 1820 1830 

CTGGAAACGA CGCTTGCGCG TGCAGAGGCC 
GACCTTTGCT GCGAACGCGC ACGTCTCCGG 

1870 1880 1890 

GCGATCGTCG TCGTCGGCGA GGTGGTGCGG 



1000 . 1010 1020 

TCCAGGCGGC GGAGGCTGTC TGATGCATTC 
AGGTCCGCCG CCTCCGACAG ACTACGTAAG 

1060 • 1070 1080 

CCGGGGTTrC TCTCAAGTGG AATCCGGTTC 
GGCCCC^G AGAGTTCACC TTAGGCCAAG 

1120 . 1130 1140 

TGGCGCCGAA ATACAGGTGG GACAGCACGC 
ACCC5CG(|CTT TATGTCQWjC CTGTCGTGCG 

1180 1190 1200 

GCGCTCGAAA AAGGTTCGGT CTGGCTGGTC 
CGCGAGCTTT TTCCAAGCCA GACCGACCAG 

1240 . 1250 1260 

ACGCTGCATG CGGCtAATGC GCTGCGCCAG 
TGCGACGIAC GCCGGTTA.CG CGACGCGGTC 

1300 1310 1320 

AACGAGGATT GCCTGAAGCT CGCGCGGCCG 
TTGCTCCXAA CGGACTTCGA GCGCGCCGGC 

1360 , 1370 1380 

GGCGGCAAGC CGTCGCCGAA GCAGCGCGAC 
CCGGCGT^G GCAGCGGCTT CGTCGCGCTG 

:i420 1430 1440 

gccggcaKcc GGGTQCTGCG CCTCAAAGGC 
CGGCCGTTGG CCCACGACGC GGAGTTTCCG 

1480 1490 1500 

6AGGAGGCGC TGACGCTGGT CGAACACCAG 
CTCCTCCGCG ACTGCGACCA GCTTGTGGTC 

1540 1550 1560 

GCCGGTATCG GCGGGCTTGC CTATGCCGGC 
CGGCCATAGC CGCCCGAACG GATACGGCCG 

1600 1610 1620 
GCGGTCACTT TCCTGACTGG CCATGATTCC 
CGCGAGTGAA AG^CTGACC GGTACTAAGG 

1660 1670 1680 

CaGGGCaxCG CCAGCGGCTC GCCTGTCATC 
gtcccg!tagc GGTCGCCGAG CGGACAGTAG 

1720 1730 1740 

GCGATCACCG CCAACCTCAT TGCCGGCGGC 
CGCTAGTGGC GGTTGGAGTA acggccgccg 

1780 1790 1800 

TGCAACGCCG CGACGCCGCA GCAGGCGGTG 
ACGTTGCGGC GCTGC(^GT cgtccgccac 

1840 1850 1860 

gatgttgcgg CGGCAGGGCT GGAGCCGCCG 
CTAOACGCC GCCGTCCCGA CCTCGGCGGC 

1900 1910 1920 

CTGCGdSCAG CGCTCGACTG GATCGGCGCG 
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CGCTAGCAGC AGCAGCCGCT CCACCACGCC GACGCGCGTC GCGAGCTGAC CTAGCCGCGC 

1930 1940 1950 1960 1970 1980 
CTGGACGGGC GCAAGCTTGC CGCCGACX:CG TTCGCGAATC GCATTCTCAG GAACCCGGCA 
GACCTGCCCG CGTTCGAACG GCGGCTGGGC AAGCGGTTAG CGTAXGAGTC CTTGGGCCGT 

1990 2000 2010 .2020 2030 2040 
TGAGCGGATT GCTGATTGCC GCACCCGCGT CCGGCtdCGG CAAGACGACG GTGACGCTCG 
ACTCGCCTAA CGACTAACGG CGTGGGCGCA GGCCG&GGCC GTTCTGCTGC CACTGCGAGC 

2050 2060 2070 2080 2090 2100 
GGCTGATGCG CGCCCTGAAG AGGCGCGGCG TGGCGATCGC GCCCGGCAAG GCGGGGCCGG 
CCGACTACGC GCGGGACTTC TCCGCGCCGC ACCGCTAGCG CGGGCCGTTC CGCCCCGGCC 

2110 2120 2130 2140 2150 2160 
ACTATATCGA TCCCGCTTTC CACGCGGCAG CGACCGGCGA GCCCTGCTTC AACTACGACC 
TGATATAGCT AGGGCGAAAG GTGCGCCGTC GCTGGCCGCT CGGGACGAAG TTGATGCTGG 

2170 2180 2190 2200 2210 2220 
CCTGGGCGAT GCGCCCGGAA CTGCTGCTTG CCAATGGGTC GCATGTGGCC TCCGGCGGGC 
GGACCCGCTA CGCGGGCCTT GACGACGAAC GGTTACGCAG CGTACACCGG AGGCCGCCCG 

2230 2240 2250 2260 2270 2280 
GCACATTGAT CGTCGAGGCG ATGATGGGAC TGCATGACGG TGCTGCCGAC GGCTCGGGAA 
CGTGTAACTA GCAGCTCCGC TACTACCCTG ACGTACTGCC ACGACGGCTG CCGAGCCCTT 

2290 2300 2310 2320 2330 : 2340 
CGCCAGCGGA CCTCGCCGCG ACGCTGAACC TTGCGGTCAT TCTGGTGGTC GATTGCGCCC 
GCGGTCGCCT G6AGCGGCGC TGCGACTTGG AACGCCAGTA AGACCACCAG CTAACGCGGG 

2350 2360 2370 2380 2390 2400 
GCATGTCCCA GTCGGTTGCC GCCCTCGTGC GCGGCTATGC GGATCATCGC GACGATATCC 
CGTACAGGGT CAGCCAACGG CGGGAGCACG CGCCGATACG CCTAGTAGCG CTGCTATAGG 

2410 2420 2430 2440 2450 2460 
GGGTGGTTGG CGTCATCCTC AACAAGGTCG GCAGCGATCG GCATGAAATG ATGCTGCGCG 
CCCACCAACC GCAGTAGGAG TTGTTCCAGC CGTCGCTAGC CGTACTTTAC TACGACGCGC 

2470 2480 2490 2500 2510 2520 
ATGCGCTCGG CAAGGTGCGC ATGCCTGTCT TCGGCGTGCT CCGGCAGGAC AGCGCATTGC 
TACGCGAGCC GTTCCACGCG TACGGACAGA AGCC(^CGA GGCCGTCCTG TCGCGTAACG 

2530 2540 2550 = 2560 2570 2580 
AACTGCCGGA GCGCCATCTC GGGCTCGTGC AGGCGGGOSA ACACTCAGCG CTTGAGGGCT 
TTGACGGCCT CGCGGTAGAG CCCGAGCACG TCCGCCCGCT TGTGAGTCGC GAACTCCCGA 

2590 2600 2610 2620 2630 2640 
TCATCGAGGC GGCGGCCGCG CGGGTCGAGG CTGCCTGCGA TCTCGACGCC ATCCGCCTGA 
AGTAGCTCCG CCGCCGGCGC GCCCAGCTCC GACGGACGCT AGAGCTGCGG TAGGCGGACT 

2650 2660 2670 2680 2690 2700 
TCGCGACGAT TTTCCCGCAG GTGCCCGCGG CGGCCGATGC CGAGCGTTTG CGGCCGCTCG 
AGCGCTGCTA AAAGGGCGTC CACGGGCGCC GCCGGtTACG GCTCGCAAAC GCCGGCGAGC 

2710 2720 2730 2740 2750 2760 
GTC3VGCGCAT CGCGGTCGCG CGCGATATCG CCTTTGCCTT CTGGTACGAG CACCTGCTTT 
CAGTCGCGTA GCGCCAGCGC GCGCTATAGC GGAAACGGAA GACi^TGCTC GTGGACGAAA 

2770 2780 2790 2800 2810 2820 
ACGGCTGGCG GCAAGGCGGC GCGGAGATTT CCTTCTTCTC GCCGCTCGCC GACGAGGGGC 
TGCCGACCGC CGTTCCGCCG CGCCTCTARA GGAAGAAGAG CGGCGAGCGG CTGCTCCCCG 

2830 2840 2850 2860 2870 2880 
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CGGATGCGGC AGCCGATGCC GTCTATCTTC CGGGGGGTrA TCCGGAGCTG CATGCGGGGC 
GCCTACGCCG TCGGCTACGG CAGATA6AAG GCXCCC^ ASG^ GTACGCCCCG 

2890 2900 2910 2920 2^30 2940 
AGCTGAGCGC CGCCGCCCGA TTCCGTTCCG GCATGCATTC CGCGGCGG?^ CGCGGCGCCC 
TCGACTCGCG GCGGCGGGCT AAGGCAAGGC CGTAO§TAAG GCGCCGCCTT GCGCCGCGGG 

2950 2960 2970 "’2980 ' 2990 3000 
GCATCTTCGG cgagtgcggc ggctatatgg tgctcGgcga AGGGCTTGTC GCTGCCGATG 
CGTAGAAGCC GCTCACGCCG CCGATATACC ACGAGCGCT TCCCGAACAG CGACGGCTAC 

3010 3020 3030 3040 3050 3060 
GCACACGCTA CGACATGCTC GGCCTGCTGC CGCTCGTAAC CAGTTTXGCC GAGGGCAGGC 
CGTGTGCGAT GCTGTACGAG CCGGACGACG GCGA^TTG GTCAAAACGG CTCGCGTCCG 

3070 3080 3090 \ ,3100 3110 3120 
GGCACCTCGG CTATCGCCGC GTCGTGCCTG TCGAC3VACGC CTTCTTCGAT GGACCCATGA 
CCGTGGAGCC GATAGCGGCG CAGCACGGAC AGCTGfTGCG GAA(^GC?TA CCTGGGTACT 

3130 3140 3150 3160 3170 3180 
CGGCGCACGA ATTCCACTAT GCGACCATCG TCGCCGAAGG GGCGGCCGAT CGGCTGTTTG 
GCCGCGTGCT TAAGGTGATA CGCTGGTAGC AGCGGCTTCC CCG&GGCTA GCCGACAAAC 

3190 3200 3210 3220 3230 3240 
CGGTCAGCGA CGCCGCCGGC GAGGATCTCG GCCA0SCGGG CCTCCGGCGC GGCCCTGTCG 
GCCAGTCGCT GCGGCGGCCG CTCCTAGAGC CGGTCCGCCC GGAGGCCGCG CCGGGACAGC 

3250 3260 3270 3280 3290 3300 
CCGGTTCCTT CATGCATCTG ATCGACGTCG CAGGXG?TGC AT6AGCGCAC eGATCGTTCA 
GGCCAAGGAA GTACGTAGAC TAGCTGCAGC GTCCACGACG TACTCGCGTG GCTAGCAAGT 

3310 3320 " 3330 3340 3350 3360 
TGGTGGCGGC atcaccgagg ccgcagcgcg ctatggcggc cggcctgaag actggctcga 
ACCACCGCCG TAGTGGCTCC GGCGTCGCGC GATACCGCCG GGCGGApTTC TSACCGAGCT 

3370 3380 3390 3400 3410 3420 
TCTGTCGACC GGCATCAATC CATGCCCCGT CGCGtTGCCC GCGGTCCCTG AGCGCGCCTG 
AGACAGCTGG CCGTAGTTAG GTACGGGGCA GCGGAACGGG CGCCAGGGAC TCGCGCGGAC 

3430 3440 3450 3460 3470 3480 
GCACCGGCTG CCGGATCGGC AGACGGTAGA TGATGCGCGG AGCGCCGCCG CCGACTACTA 

cgtggccgac ggcctagccg tctgccaxct actacgcgcc tcgcGgcggc ggctgatgat 

3490 3500 3510 3520 ' , 3530 3540 
CCGCACCAAC GGCGTGCTGC CTTTGCGGGT GCCGGSCACC CAGTCGGTGA TCCAGCTCCT 
GGCGTGGTTG CCGGACGACG GAAACGGCCA CGGCCCGTGG GtCAGCCACT AGGTCGAGGA 

3550 3560 3570 3580 u 3590 3600 
GCCACGTCTT GCTCCGGCCA ACAGGCACGT CGCGj^TTTTC GGGCCdACCT ATGGCGAGTA 
CGGTGCAGAA CGAGGCCGGT TGTCCGTGCA GCGGTAWG CCCGGCTG6A TACCGCTCAT 

3610 3620 3630 3640 3650 3660 
TGCCCGCGTG CTTGAAGCGG CCGGCTTTGC TGTCGATCGC GTCGCG^TG CCGACGCGCT 
ACGGGCGCAC GAACTTCGCC GGCCG^CG ACAGCTAGCG CAGCGCCTAC GGCTGCGCGA 

3670 3680 3690 3700 3710 3720 
CACGGCCGAA CATGGGCTTG TCATCGTCGT CAACCCCAAC AACCCGACCG GCCGCGCCTT 
GTGCCGGCTT GTACCCGAAC AGTAGC^GCA Gip'GGGGTTG TTGGGCTGGC CGGCGCGGAA 

3730 3740 3750 3760 3770 3780 
GGCGCCGGCG GAGCTTCTGG CGATCGCCGC AAGGCAGAAG GCGAGCGGCG QlCTGCTGCT 
CCGCGGCCGC CTCGAAGACC GCTAGCGGC6 TTCSCjTCTTC CGCTCGCCGC CTGACGACGA 
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3790 3800 3810 3820 ./ 3830 3840 
GGTCGATGAG GCCTTCGGCG ATCTTGAGCC GCAACTGAGT GTCGCTGGTC ACGCGTCAGG 
CCAGCTACTC CGGAAGCCGC TAGAACTCGG CGTT(^CTCA CAGCSACCAG TGCGCAGTCC 

3850 3860 3870 3880 3890 3900 
GCAAGGCAAC CTCATCGTCT TCCGCTCCTT CGGCfl^lTC TTCGGCCTTG CGGGCCTGCG 

C6TTCCGTTG GAGTAGCAGA AGGCGAGGAA GCCGWCAAG AAGCCGGAAC GCCCGGACGC • 

- -. >• 

3910 3920 3930 3940 3950 3960 
CCTCGGCTTC GTCGTTGCGA CCGAGCCAGT GCTT^TCC TTTGGCGATT GGCTCGGTCC 

ggagccgaag cagcaacgct ggctcggtca cgaac6tagg aaacggctaa ccgagccagg 
3970 3980 3990 4000 4010 4020 

ctgggctgtc tccggcccgg cgttgacgat ctcgwagcg ctgatgcagg gcgatacgaa 

GACCCGACAG AGGCCGGGCC GCAACTGCTA GAGCl^CGC GACTACGTCC CGCTATGCTT 

4030 4040 4050 4660 4070 4080 
GGC6ATCGCG GCGGGCATCC TCGAGCGTCG CGCCGGCCtC GATGCGGCTC TCGATGGGGC 
CCGCTAGCGC CGCCCGTAGG AGCTCGCAGC GCGGCCGtaG CTACGCCGAG AGCTACCCCG 

4090 4100 4110 4120 4130 4140 
AGGGCTCAAC CGTATCGGCG GCACGGGGCT ATTCGTGCTG GTCGAGGATC CCAGGGCAGC 
TCCCGAGTTG GCATAGCCGC CGTGCCCCGA TAAGCACGAC CAGCTCGTAG GGTCCCGTCG 

4150 4160 4170 4180 4190 4200 
TCTGCTGCAG GAGCGGCTCT GCGAGGCCCA TATTCTCACG CGCAAGTTCG ACTATGCCCC 
AGACGACGTC CTCGCCGAGA CGCTCCGGGT ATAAGAGTGC GCGTTCAAGC TGATACGGGG 

4210 4220 4230 4240 4250 4260 
GACCTGGCTC AGGGTCGGTC TTGCGCCTGA CGCGGCTGGT GACCGACGGC TGGCGGACGC 
CTGGACCGAG TCCCAGCCAG AACGCGGACT GCGGC^CCA CtGGCTGCCG ACCGCCTGCG 

' -A' 

4270 4280 4290 4300 4310 4320 
GCTTGCCCGC ATGGAGCTCT GAGGTGTCGG AGACGAtCCT GCTCATTCTC GCGCTG6CGC 
CGAACGGGCG TACCTCGAGA CTCCACAGCC TCTGCTAGGA CGAGTAAGAG CGCGACCGCG 

4330 4340 4350 4360 4370 4380 
TGGTGATCGA CCGCGTTGTC GGCGATCCGG ACTGGCTCTG GGCGCGCGTG CCGCATCCGG 
ACCACTAGCT GGCGCAACAG CCGCTAGGCC TGACCGAGAC CCGGGCGCAC GGCGTAGGCC 

4390 4400 4410 4420 4430 4440 
TCGTGTTTTT CGGCAAGGCC ATCGGCTTTT TCGAC^GCG GCTGIACGGG GAGGACCTCG 
AGCACAAAAA GCCGTTCCGG TAGCCGAAAA AGCTGCGCGC CGACTTGGCC CTCCTGGAGC 

4450 4460 4470 4460 4490 4500 
AGGATAGCGC GCGCAAATTT CGTGGCGTCG TCGCGATCCT TTTGTTGCTT GGCATCAGCG 
TCCTATCGCG CGCGTTTAAA GCACCGCAGC AGCQCTAGGA AAACAACGAA CCGTAGTCGC 

4510 4520 4530 4540 '4550 4560 
CCTGGTTCGG CCATCTGCTG CATCGCCTGT TCGGCGTCd' CGGACCGCTC GGCTTTCTGC 
GGACCAAGCC GGTAGACGAC GTAGCGGACA AGCGGCAGGA GCCTGGCGAG CCGAAAGACG 

4570 4580 4590 4600 ‘ 4610 4620 
TCGAGGCGGT TCTGGTCGCG GTCTTCCTGG CACAQAGAG CCTCGCciSAT CACGTGCGTC 
AGCTCCGCCA AGACCAGCGC CAGAAGGACC GTGTCTXCTC GGAGdSGCTA GTQCACGCAG 

4630 4640 4650 4660 ' : -4670 4680 
GCGTGGCCGG GGGCTTGCGA CAGGGCGGGC TGGAAGGCGG GCGIGC^GGCC GTGTCGATGA 
CGCACCGGCC CCCGAACGCT GTCCCGCCCG ACCTTCCGCC CGCAC(^GG CACAGCTACT 

4690 4700 4710 . 4720 4730 4740 
TCGTTGGTCG CGATCCAAAG ACGCTCGACG ^l?CG(^QGT CTGCCGTGCC GCGATCGAAA 
AGCAACCAGC GCTAGGTTTC TGCGAGCTGC TfeGi^CGCCA aCG^CGG CGCTAGCTTT 
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4750 4760 4770 
GCCTTGCCGA GAATTTCTCC GACGGCGTCG 
CGGAACGGCT CTTAAAGAGG CTGCCGCAGC 

4810 4820 4830 
GCCTGCCGGG GCTTCTTGCC TACAAGATGC 
CGGACGGCCC CGAAGAACGG ATGTTCTACG 

4870 4880 4890 
AGTCGCCGAA ATATCTGCAC TTCGGCTGGG 
TCAGCGGCTT TATAGACGTG AAGCPGACCC 

4930 4940 4950 
TGCCGGCAGC GAGGCTCTCG ATCCTTTTGA 
ACGGCCGTCG CTCCGAGAGC TAGGAAAACT 

4990 5000 5010 
CCAGCGCCGC CAAGGATGCG CTGACCGTGG 
GGTCGCGGCG GTTCCTACGC GACTGGCACC 

5050 5060 5070 
CGAACTCCGG CTGGCCGGAA GCGGCCATGG 
GCTTGAGGCC GACCGGCCTT CGCCGGTACC 

5110 5120 5130 
CGCGGATCTA TGGCGGCGTC AAGGTCAGCG 
GCGCCTAGAT ACCGCCGCAG TTCCAGTCGC 

5170 5180 5190 
TTGCAACAAG CGAAGACATC GACGCCGGTA 
AACGTTGTTC GCTTCTGTAG CTGCGGCCAT 

5230 5240 5250 
TGGCCGGGTT TGTTCTTGCA ATCGCAATGA 
ACCGGCCCAA ACAAGAACGT TAGCGTTACT 

5290 5300 5310 
GACTCTGCTT TCCATATGTA TTAAGATCGT 
CTGAGACGAA AGGTATACAT AATTCTAGCA 

5350 5360 5370 
GTTTGGTTCC ACCGGTACGT GTTCGTCTTC 
CAAACCAAGG TGGCCATGCA CAAGCAGJ^G 



4780 4790 4800 

TGGCGCCGGC CTTCTGGTAC GCGGTTGCCG 
AC(^GGCCG GAAGACCATG CGCCAACGGC 

4840 4850 4860 

TGAACACCGC CGATTCGATG ATCGGCCACA 
AClTGTGGCG GCTAAGCTAC TAGCCGGTGT 

4900 4910 4920 

CCTCGGCCCG AGTCGACGAT CTCGCCAACC 
GGAGCCGGGC TGAGCTGCTA GAGCGGTTGG 

4960 4970 4980 

TCTCAGCCGG TGCGCTGATC CATCGTGGCG 
AGAGTCGGCC ACGCGACTAG GTAGCACCGC 

5020 5030 5040 

CCCTTCGCGA CCATGGCCTG CACCGCTCGC 
GGGAAGCGCT GGTACCGGAC GTGGCGAGCG 

5080 5090 5100 

CCGGCGCGCT CGATCTGCAG CTTGCCGGTC 
GGCCGCGCGA GCTAGACGTC GAACGGCCAG 

5140 5150 5160 

AACCTATGAT CAACGGTCCG 6GCCGAGCGG 
TTGGATAGTA GTTGCGAGGC CCGGCTCGCC 

5200 ’ 5210 5220 

TTGCTGTATT TTATGGCGCC TGTACGGTCA 
AACGACAIAA AATACCGCGG ACATGCCAGT 

5260 5270 5280 

TTTGRTCGCG GAAGTTGACC TTCGCATTAA 
AAACTAGCGC CTTC*ACTGG AAGCGTAATT 

5320 5330 5340 

ATCATATTCG ATCAGTTATT CTCCTGGAAC 
TAGXATAAGC lAGTCAATAA GAGGACCTTG 

5380 5390 5400 

CCGGAGAGAG AAGCATGCGC AAAAGCTT 
GGCCTCTCTC TTCGTACGCG TTTTCGAA 
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10 20 30 -fAQ 50 60 
GAATTCGCCA GCGCCTACAT GGCTGACCTC AAGCAGTTCC TCGTGGCCCA GAAGAACGAG 
CTTAAGCGGT CGCGGATGTA CCGACTGGAG TTCGTCAAGG AGCACCGGGT CTTCTTGCTC 

70 80 90 100 no 120 
GGCCGGCAGA TTTTCCCTCG CGGGCCTGAG TATTTTCGCG CGCTCGACCT GACGCCGCTC 
CCGGCCGTCT AAAAGGGAGC GCCCGGACTC ATAAAAGCGC GCGAGCTGGA CTGCGGCGAG 

130 140 150 160 170 180 
GACAAGGTGC GCGTGGTCAT TCTCGGCCAG GATCCCTATC ACGGTGACGG CCAGGCGCAT 
CTGTTCCACG CGCACCAGTA AGAGCCGGTC CTAGG(»TAG TGCCACTGCC GGTCCGCGTA 

190 200 210 220 230 240 
GGGCTCTGCT TCAGCGTTCG CCCCGGTGTC CGGACGCCGC CGTCGCTGGT CAACATCTAC 
CCCGAGACGA AGTCGCAAGC GGGGCCACAG GCCTGCGGCG GCAGCGACCA GTTGTAGATG 

250 260 270 280 290 300 
AAG6AACTGA ATACCGATCT CGGTATTCCG CCGGCGCGTC ACGGTTTTCT CGAAAGCTGG 
TTCCTTGACT TATGGCTAGA GCCATAAGGC GGCCGGGCAG TGCCAAAAGA GCTTTCGACC 

310 320 330 340 350 360 
GCAAGGCAGG GCGTGCTGCT TTTGAACAGC GTGCTGACGG TAGAGCGCGG 6AACGTGCGT 
CGTTCCGTCC CGCACGACGA AAACTTGTCG. CACGACTGCC ATCTCGCGCC CtTGCACGCA 

370 380 390 : 400 410 420 
CACACCAGGG TCACGGTTGG GAAAAGTTCA CG6ATGCGAT CATCCGTGCG GTCAACGAGG 
GTGTGGTCCC AGTGCCAACC CTTTTCAAGT GCCTACGCTA GTAGGCACGC CAGTTGCTCC 

430 440 450 460 470 480 
CCGAGCATCC CGTCGTCTTC ATGCTTTGGG GCTCCTATGC GCAGAAGAAG GCGGCCTTCG 
GGCTCGTAGG GCAGCAGAAG TACGAAACCC CGAGGATACG CGTCTTCTTC CGCCGGAAGC 

490 500 510 520 530 540 
TCGACCGCTC GCGCCATCTT GTCCTGAGGG CACCACATCC GTCGCCGCTC TCAGCCCATT 
AGCTGGCGAG CGCGGTAGAA CAGGACTCCC GTGGTGTAGG CAGCGGCGAG AGTCGGGT;A 

550 560 570 580 590 600 
CCGGCTTTCT CGGCTGCCGG CATTTTTCCC AGGCCAATGC CTTCCTCGAA AGCAAAGGCT 
GGCCGAAAGA GCCGACGGCC GTAAAAAGGG TCCGGTTACG gaaggagctt tcgtttccga 

610 620 630 640 650 . 660 
TCGATCCGAT CGACTGGCGG CTGCCGGAAA ATCCGGCTGC GGACATCAAC TGAAGGCTTG 

AGCTAGGCTA gctgaccgcc gacggccttt taggccgacg cctgtagttg acttccgaac 

670 680 690 700 710 720 
GCGCGAATGA CGGCTTTGTC GTCGCCCTGA GGTCTTGCCT TGGCGGCGGC GATCCGCCTA 
CGCGCTTACT GCCGAAACAG CAGCGGGACT CCAGAACGGA ACCGCCGCCG CTAGGCGGAT 

730 740 750 760 770 780 
AGACGCCCGA ACGAAATGGC GGAGGCGGGC ATGCGCAAAA TTCTGATCAT CGGCATCGGT 
TCTGCGGGCT TGCTTTACCG CCTCCGCCCG TAC(^TTrT AAGACTAGTA GCCGTAGCCA 

790 800 810 820 830 840 
TCGGGCAATC CCGAACACAT GACCGTGCAG GCGATCAACG CGCTGAACTG CGCCGACGTG 
AGCCCGTTAG GGCTTGTGTA CTGGCACGTC CGCTAGTTGC GCGACTTGAC GCGGCTGCAC 

850 860 8*70 880 890 900 
CTCTTTATCC CGACCAAGGG AGCGAAGAAG AGCG^TTG CCGAAGTGCG CCGCGACATC 
GAGAAATAGG GCTGGTTCCC TCGCTTCTTC TGGCiCGAAC GGCTTCACGC GGCGCTGTAG 

910 920 930 940 950 960 
TGCGCCCGCT ACGTCACGCG CAAGGACAGC CGCACCGTCG AGTTCGCGGT GCCCGTGCGG 
ACGCGGGCGA TGCAGTGCGC GTTCCTGTCG GCGTG^CAGC TCAAGCGCCA CGGGCACGCC 
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970 980 990 1000 1010 1020 
CGCACCGAAG GCGTCAGCTA TGACGGCAGC GTCGATGACT GQCACGCCCA GATCGCTGGG 
GCGTGGCTTC CGCAGTCGAT ACTGCCGTCG CAGCX/iCTGA CCGTGC^GGT CTAGCGACCC 

1030 1040 1050 1060 1070 1080 
ATTTACGAAG CGCTTCTATC GAAGGAGTTG GGCGAAGAGG GJtfVCTGGCGC GTTTCTCGTC 
TAAATGCTTC GCGAAGATAG CTTCCTCAAC CCGCTTCTCC CTTGACCGCG OVAAGAGCAG 

1090 1100 1110 1120 1130 1140 
TGGGGCGACC CGATGCTCTA TGACAGCACC ATTCGCATCG TCGAGCGGGT CAAGGCACGC 
ACCCCGCTGG GCTACGAGAT ACTGTCGTGG TAAGCSi'^GC AGCTCGCCCA GTTCCGTGCG 

1150 1160 1170 ...1186 1190 1200 
GGT6AGGTCG CCTTCGCCTA CGACGTCATT CCCGGGATCA CCAGTCTGCA GGCGCTTTGC 
CCACTCCAGC GGAAGCG6AT GCTGCAGTAA GGGCCCTAGT GGTCAGACGT CCGCGAAACG 

1210 1220 1230 1240 1250 1260 
GCCAGCCACC GCATTCCGCT GAACCTCGTC GGCAAGCCGG TGGAGATCAC CACGGGGCGT 
CGGTCGGTGG CGTAAGGCGA CTTGGAGCAG CCGTTCGGCC ACCTCTAGTG GTGCCCCGCA 

1270 1280 1290 1300 1310 1320 
CGGCTGCACG AAAGCTTTCC CGAGAAGAGC CAGACCTCGG TCGTCATGCT CGATGGCGAA 
GCCGACGTGC TTTCGAAAGG GCTCTTCTCG GTC^GAGCC AGCAGTACGA gctaccgctt 

1330 1340 1350 1360 1370 1380 
CAGGCGTTTC AGCGGGTCGA GGACCCGGAG GCGGAGATCT ATTGGGGCGC CTATCTCGGC 
GTCCGCAAAG TCGCCCAGCT CCTGGGCCTC CGCCTCTAGA TAACCCCGCG GATAGAGCCG 

1390 1400 1410 1420 1430 1440 
ACGCGGGATG AGATCGTCAT TTCCGGCCGC GTGGCyGAGG TGAAGGACCG GATCCTTGAA 
TGCGCCCTAC TCTAGCAGTA AAGGCCGGCG CACCC^CTCC ACTTCCTGGC CTAGGAACTT 

1450 1460 1470 1480 1490 1500 
ACGCGGGCGG CGGCGCGCGC GAAGATGGGA TGGATCATGG ACATCTATCT CCTGCGCAAG 
TGCGCCCGCC GCCGCGCGCG CTTCTACCCT ACCTAGTACC TGTAGATAGA GGACGCGTTC 

1510 1520 1530 1540 1550 1560 
GGCGCCGACT TCGACGAGTG ACGGGGAGGG CCGATCTGCG TCGTGTTTGA TCTCACTCAA 
CCGCGGCTGA AGCTGCTCAC TGCCCCTCCC GGClTlGACGC AGCACAAACT AGAGTGAGTT 

1570 1580 1590 ‘'1600 1610 1620 
GGTTTGCGGC TGTGTTATAG CGTCTTAAGA GGCTTCTTCA GGGAGGAGAA CCTCAAGTGA 
CCAAACGCCG ACACAATATC GCAGAATTCT CCGAAGAAGT CCCJCCTCTT GGAGTTCACT 

1630 1640 1650 1660 1670 1680 
TGACGGATTT GATGACCAGC TGCGCCCTTC CATTGACCGG AGATGCCGGC ACCGTCGCTT 
ACTGCCTAAA CTACTGGTCG ACGCGGGAAG GTAACTGGCC TCTAC6GCCG TGGCAGCGAA 

1690 1700 1710 1720 1730 1740 
CGATGCGCCG CGGCGCCTGC CCGTCCTTGG CAGAGCCGAT GCAGACCGGC 6ACGGCCTGC 
GCTACGCGGC GCCGCGGACG GGCAGGAACC GTCTCGGCTA CGT^TGCCCG CTGCCGGACG 

1750 1760 1770 1780 1790 1800 
TCGTGAGGGT GAGGCCAACG GATGACAGCC TGACGCTGCC GAAGGTCATT GCCCTTGCCA 
AGCACTCCCA CTCCGGTTGC CTACTGTCGG ACTGCGACGG CTTCCAGTAA CGGGAACGGT 

1810 1820 1830 1840 1850 1860 
CGGCTGCCGA GCGCTTCGGC AATGGCATCA TCGAGATTAC CGCGCGCGGA AACCTGCAGC 
GCCGACGGCT CGCGAAGCCG TTACCGTAGT AGCTGTAATG GCGCGCGCCT TTGGACGTCG 

1870 1880 1890 1900 ' 1910 1920 
TTCGCGGCCT gagcgcggct tcggtgccaa ggctggcgca ggcgatcggc gatgcggaga 
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AAGCGCCGGA 


CTCGCGCCGA 


AGCCACGGTT 


1930 


1940 


1950 


TCGCCATTGC 


CGAGGGGCTC 


GCGATCGAGG 


AGCGGTAACG 


GCrCCCCGAG 


CGCTAGCTCC 


1990 


2000 


2010 


AGATCGCCGA 


TCCGCGGCCG 


ATTGCCACTG 


TCTAGCGGCT 


AGGCGCCGGC 


TAACGGTGAC 


2050 


2060 


2070 


TGCCGTTGAA 


GCTTGCACCC 


AAATTATCCG 


ACGGCAACTT 


CGAACGTGGG 


TTTAATAGGC 


2110 


2120 


2130 


TCGGCGCTGT 


CGTCGCCGAC 


ATTCGCCTTC 


AGCCGCGACA 


GCAGCGGCTG 


TAAGCGGAAG 


2170 


2180 


2190 


GGGTGCTGTC 


GCTTGGCGGC 


ACGTCAACGA 


CCCACGACAG 


CGAACCGCCG 


TGCAGTTGCT 


2230 


2240 


2250 


ACGCGGTCGT 


GCCGGCCCTG 


ATCACCATTC 


TGCGCCAGCA 


CGGCCGGGAC 


TAGTGGTAAG 


2290 


2300 


2310 


TGCGCGGGCG 


CGATCTGGAC 


CCGTCGGAAA 


ACGCGCCCGC 


GCTAGACCrC 


GGCAGCCTTT 


2350 


2360 


2370 


CCGAACGCCC 


GGCCGCTCCG 


CGTTCGGCCG 


GGCTTGCGGG 


CCGGCGAGGC 


GCAAGCCGGC 


2410 


2420 


2430 


CCGACACCGT 


TCTCGGCCTC 


GGTCTGGCCT 


'GGCTGTGGCA 


AGAGCCGGAG 


CCAGACCGGA 


2470 


2480 


2490 


CCTACCTGCA 


TCAGGTCCAG 


GCGCTTGGCG 


GGATGGACGT 


AGTCCAGGTC 


CGCGAACCGC 


2530 


2540 


2550 


CCTTCTTCGT 


CCTCGGCCTT 


TGCCCCGAGA 


GGAAGAAGCA 


GGAGCCGGAA 


ACGGGGCTCT 


2590 


2600 


2610 


CACACGGTTT 


TCGCATTGCC 


GAGCAGGATC 


GTGTGCCAAA 


AGCGTAACGG 


CTCGTCCTAG 


2650 


2660 


2670 


GCAAGGGTTG 


CGCCTCGGCG 


TGGATGGAAA 


CGTTCCCAAC 


GCGGAGCCGC 


ACCTACCTTT 


2710 


2720 


2730 


CGGCGCCGGA 


ATTGCTCGAC 


GGGTCGCTCA 


GCCGCGGCCT 


TAACGAGCTG 


CCCAGCGAGT 


2770 


2780 


2790 


GCGCCCGGCC 


GAAGCCGTCC 


GAACTGACGC 


CGCGGGCCGG 


CTTC6GCAGG 


CTTGACTGCG 


2830 


2840 


2850 



4^/dr^ - 

CCGACCGCGT CCGCTAGCCG CTACGCCTCT 

1960 1970 1980 

TGCCGCCCCT GGCGGGCATC GACCCGGACG 
ACGGCGGGGA CCGGCCGTAG CTGGGCCTGC 

.2020 2030 2040 
AGCTTCGTGA AGCGTTGGAT gtgcgccagg 
TCGAAGCACT TCGCAACCTA CACGCGGTCC 

2080 2090 2100 

TCGTCATCGA TAGCGGTGGC CGGTTTGGTC 
AGCAGTAGCT ATCGCGACCG GCCAAACCAG 

2140 2150 2160 

AGGCGGTTTC GACTGTCGCG GGGGTGGCCT 
TCCGCCy^G CTGACAGCGC CCCCACCGGA 

2200 2210 2220 
AGGCATCGAG CGTOGGGACG TTGGCCGGCA 
TCCGTAGCTC GCAGCCCTGC AACCGGCCGT 

2260 2270 2280 

TCGAGAAACT GGCGAGCCTG GGCACGACGA 
AGCTCTTTGA CCGCTCGGAC CCGTGCTGCT 

2320 2330 2340 

TCCGCGCGCT CTGTCGCTGT GAGACATCGT 
AGGCOdGCGA GACAGCGACA CTCTGTAGCA 

2380 2390 2400 

CAATACCCGG CATTCATGCG CTGGGTAACG 
GTTATGGGCC GTAAGTACGC GACCCATTGC 

2440 2450 2460 

TTGCTGAGGT GGAGGCCGCC GCGCTGGCAT 
AACGAGTCCA CCTCCGGCGG CGCGACCGTA 

2500 2510 2520 

CCAATGCGAT CCGGCTTGCG CCCGGGCACG 
GGTTACGCTA GGCCGAACGC GGGCCCGTGC 

2560 2570 2580 

CCGCGGCTGT GGCGCAGAGC CTGGCAGCGT 
GGCGCCGACA CCGCGTCTCG GACCGTCGCA 

2620 2630 2640 

CGCGCAATGC GATCGCCACC TGCGCCGGCA 
GCGCGTTACG CTAGCGGTGG ACGCGGCCGT 

2680 2690 2700 

CCAAGGGCAT GGCCGAQCGC CTCGTCGAGA 
GGTTCCCGTA CCGGCTCGCG GAGCAGCTCT 

2740 2750 2760 

CCGTGCATCT CTCCGGCTGC GCCAAGGGCT 
GGCACGTAGA GAGGCCGACG CGGTTCCCGA 

2800 '-2810 2820 
TTGTCGGTGC GCCMCA^GGA TACGGGCTTG 
AACAGCCACG CGGllAGrCCT ATGCCCGAAC 

2860 2870 2880 
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TCGTAAATGG GGCTGCCAAT GGCTTGCCAA GCGCCTACAC CGATGAGAAT GGAATGGGAT 
AGCATXTACC CCGACGGTTA CCGAACGGTT CGCG<ATGTG GCTACTCTTA CCTTACCCTA 

2890 2900 2910 2920 2930 2940 
CCGCCCTTGC CCGGCTCGGC CGGCTGGTGC GGCAAAACAA AGACGCTGGC GAATCGGCGC 
GGCGGGAACG GGCCGAGCCG GCCGACCACG CCGTTTTGTT TCTGCGACCG CTTAGCCGCG 



2950 2960 
AGTCCTGTCT TACACGGCTC 
TCAGGACAGA ATGTGCCGAG 

3010 3020 
CATGCCTGAG TATGATTACA 
GTACGGACTC ATACTAATGT 

3070 3080 
CATCCGCGCC GAGGCCGATC 
GTAGGCGCGG CTCCGGCTAG 

3130 3140 
CATGGTGCAC GCCTGCGGTT 
GTACCACGTG CGGACGCCAA 

3190 3200 
CGTAAGCTCG GCCCGTGCGG 
GCATTCGAGC CGGGCACGCC 

3250 3260 
GGTTGCGCAC GGTGTCACCC 
CCAACGCGTG CCACAGTGGG 

3310 3320 
GCGCGATCCT CGCACGCCCG 
CGCGCTAGGA GCGTGCGGGC 

3370 3380 
CCTGAAGCTC TGGAGCGAGC 
GGACTTCGAG ACCTCGCTCG 

3430 3440 
GGCGTTGTTC TTCCTCTTGG 
CCGCAACAAG AAGGAGAACC 

3490 3500 
CGGCATGCCC GTCGGTTTCG 
GCCGTACGGG CAGCCAAAGC 

3550 3560 
CTATGGCGTT CCCTTCGCCA 
GATACCGCAA GGGAAGCGGT 

3610 3620 
AGCGCTTAAC TCGCTCGCGA 
TCGCGAATTG AGCGAGCGCT 

3670 3680 
GGTGTTGGGA CCGGCCCCGG 
CCACAACCCT GGCCGGGGCC 

3730 3740 
GGGCAAGCCG ATGTGCTTGC 
CCCGTTCGGC TACACGAACG 



2970 2980 
GGAGCTGCGC GCGTCTCGGC 
CCTCGACGCG CGCA^GCCG 

3030 ' 3040 
TTCGCGATGG CAACGCCATC 
AAGCGCTACC GTTGCGGTAG 

3090 3100 
TGTCGCGCTT CTCCGAAGAG 
ACAGCGCGAA iGAGGCirCTC 

3150 3160 
CCGTCGAGGC GACCAGGCAG 
GGCAGCTCCG CTGGTCCGTC 

3210 3220 
CGCTGAAAGC CGGTGCGCCG 
GCGACTTTCG GCCACGCGGC 

3270 3280 
GCGCCCGTCT GCCGGCCGGC 
CGCGGGCAGA CGGCCGGCX:G 

3330 3340 
CACTTGCGGC CGAGATCGGC 
GT6AACGCCG GCTGI^GCCG 

3390 ; 3400 
GGCTGGCCGG TTCGGTGGTC 
CCGACCGGCC AAGCCACCAG 

3450 ’ 3460 
AAATGCTGCG CGACGGCX3CG 
TTTACGACGC GCTGCCGCGC 

3510 3520 
TCGGTGCGGC GGAATCGAAG 
AGCCACGCCG CCTTAGCTTC 

3570 3580 
TCGTGCGCGG CCGGCTCGGC 
AGCACGCGCC GGCGGAGCCG 

3630 3640 
GGCCGGGCCT GTGAGCGGCG 
CCGGCCCGGA CACTCGCCGC 

3690 3700 
TGATCCGGAA CTTTTGACGG 
ACTAGGCCTT GAAAACTGCC 

3750 3760 
CTATTTCGCC AAGGCCGGGC 
GATAAAGCGG TTCCGGCCCG 



?990 3000 
AGCGTTCGAA CAGGGATAGA 
TCGCAAGCTT GTCCCTATCT 

3050 3060 
TACGAGCGTT CCTTCGCCAT 
ATGCTCGCAA GGAAGCGGTA 

3110 3120 
GAAGCGGATC TGGCTGTGCG 
CTTCGCCTAG ACCGACACGC 

3170 3180 
TTCGTGTTTT CTCCCGATTT 
AAGCACAAAA GAGGGCTAAA 

3230 3240 
ATCCTCTGCG ATGCCGAGAT 
TAGGAGACGC TACGGCTCTA 

3290 3300 
AACGAGGTGA TCTGCACGCT 
TTGCTCCACT AGACGTGCGA 

3350 3360 
AACACCCGCT CCGCCGCAGC 
TTGTGGGCGA GGCGGCGTCG 

3410 3420 
GCGATCGGCA ACGCGCCGAC 
CGCTAGCCGT TGCGCGGCTG 

3470 3480 
CCGAAGCCGG CGGCAATCCT 
GGCTTCGGCC GCCGTTAGGA 

3530 3540 
GATGCGCTGG CCGAGAACTC 
CTACGCGACC GGCTCTTGAG 

3590 3600 
GGGAGTGCCA TGACGGCGGC 
CCCTCACGGT ACTGCCGCCG 

3650 3660 
TCGGCGTGGG GCGCCTGATC 
AGCCGCACCC CGCGGACTAG 

3710 3720 
TCA5iG(^GGT GAAGGCGCTC 
AGTTCCGCCA CTTCCGCGAG 

3770 3780 
6AAGCGGTAA CGGCCGCGCG 
CTTCGCCATT GCCGGCGCGC 
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3790 


3800 


3810 


^ 3820 


1^^3330 


3840 




GTGGTCGAGG 


GTCTGCTGAA 


GCCCGATCTT 


GTCGAGCiGC 


CGCTATACTA 


TCCGGTGACG 




CACCAGCTCC 


CAGACGACTT 


CGGGCTAGAA CAGCTCGACG 


GCGATATGAT AGGCCACTGC 




3850 


3860 


3870 


; 3880 


3890 


3900 




ACCGAAATCG ACAAGGACGA 


TGGCGCCTAC 


AAGACCCAGA 


TCACCGACTT 


CTACAATGCG 




TGGCTTTAGC 


TGTTCCTGCT 


ACCGCGGATG 


TTCTGGGTCT 


AGTGGCTGAA 


GATGTTACGC 


* 


3910 


3920 


3930 


3940 


3950 


3960 




TCGGCCGAAG 


CGGTAGCGGC 


GCATCTTGCC 


GCCGGGCGCA 


CGGTCGCGGT 


GCTCAGTGAA 
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AGCCGGCTTC 


GCCATCGCCG 


CGTAGAACGG 


CGGCCCGCGT 


GCCAGCGGCA 


CGAGTCACTT 
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3980 
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4010 


4020 




GGCGACCCGC 


TGTTCTATGG 


TTCCTACATG 


CATCT6CATG TGCGGCTCGC 


CAATCGTTTC 
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ACAAGATACC 


AAGGATGTAC 


GTAGACGTAC 


ACGCC6AGCG 
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4080 




CCGGTCGAGG 


TGATCCCCGG 


CATTACCGCC 


ATGTCCGGCT 


GTTGGTCGCT 


TGCCGGCCTG 




GGCCAGCTCC 


ACTAGGGGCC 


GTAATGGCQG TACAGGCCGA CAACCAGCGA ACGGCCGGAC 




4090 


4100 


4110 


4120 


4130 


4140 




CCGCTGGTGC 


AGGGCGACGA 


CGTGCTCTCG 


GTGCTTCCGG 


GCA'CCATGGC 


CGAGGCCGAG 




GGCGACCACG 


TCCCGCTGCT 


GCACGAGAGC 


CACGAAGGCC 


cgtgGtaccg 


GCTCCGGCTC 
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4170 


4180 


4190 


4200 




CTCGGCCGCA 


GGCTTGCGGA 


TACCGAAGCC 


GCCGTGATCA 


tgaaggtcgg 


GCGCAATTTG 




GAGCCGGCGT 


CCGAACGCCT 


ATGGCTTCGG 


cggcaGtagt 


ACTTCCAGCC 


CGCGTTAAAC 




4210 


4220 


4230 


: 4240 


4250 


4260 




CCGAAGATCC 


GTCGGGCGCT 


CGCTGCCTCC GGCCGTCTCG ACCAGGCCGT 


CTATGTCGAA 




GGCTTCTAGG 


CAGCCCGCGA 


GCGACGGAGG 


CCGGCAC^GC 


TGGTCCGGCA 


GATACAGCTT 




4270 


4280 


4290 


' 4300 


4310 


4320 




CGCGGCACGA 


TGAAGAACGC 


GGCGATGACG 


GCTCTTGCGG 


AAAAGGCCGA 


CGACGAGGCG 




GCGCCGTGCT 


ACTTCTTGCG 


CCGCTACTGC 


cgag^u^cgcc 


TTTTCCGGCt 


GCT6CTCCGC 
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4350 


-4360 


4370 


4380 




CCCTATTTCT 


CGCTGGTGCT 


CGTTCGCGGC 
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GGTACGCTCT 




GGGATAAAGA 


GCGACCACGA 
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ctGgtactgg 


CCATGCGAGA 
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4400 
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4420 


4430 


4440 




ATGTCGTCGG 


TACCGGACCG 


GGCAGCGCCA AGC^GATGAC 


GCCGGAAACG 


GCGGAAGCCG 




TACAGCAGCC 


ATGGCCTGGC 


CCGTCGCGGT 


TCSTGTACTG 


CGGCCTTTGC 


CGCCTTCGGC 
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4460 


4470 


..•■4480 


4490 


4500 




TTGCGGCCGC 


TCAGGAGTTT 


TACGGCTACT 


TTCCC5?ATCT 


CGACCGGCTG AACCTCAGAC 




AACGCCGGCG 


AGTCCTCAAA 


ATGCCGATGA AAGGMtAGA GCf GGCCGAC 


TTGGAGTCTG 
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4530 
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4550 


4560 




CGGATCAGAT 


CCGTGTCGCC 


TCGGACAACC 


GCG2^GAGCT CGATCGGGCA CAGGTCGCGC 




GCCTAGTCTA GGCACAGCGG 


AGCCTGTTGG CGCTCSSTCGA GGTA6CGCGT GTCCAGCGCG 
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4620 




TGACGCGGGC 


TGCGGCAGGC 


GTGAAGGTCT 


GCATGGTCTC 


CGGTGGCGAT 


CCCGGTGTCT 




ACTGCGCCCG ACGCCGTCCG 


CACTTCCAGA 


CGTl#iAGAG 

Ji.- V . 


GCCACCGCTA GGGCCACAGA 
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4640 


4650 


■'^4860 


4670 


4680 




TTGCCATGGC 


GGCCGCCGTC 


TGCGAGGCGA TCGACAAGGG ACCGGC03AA 


TGGAAGTCGG 




AACGGTACCG 


CCGGCGGCAG 


ACGCTCCGCT AGCKTICCC 


TGGCCGCCTT ACCTTCAGCC 




4690 


4700 


4710 


'■^'4720 


4730 


4740 




TTGAACTGGT 


GATCACGCCC 


GGCGTGACCG CGATGSTCGC 


CGTTGCCGCC 


CGCATCGGCG 




AACTTGACCA 


CTAGTGCGGG 


CCGCACTGGC 


GCTACGAGCG 


GCAACGGCGG 


GCGTAGCCGC 
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4750 4760 4770 
CGCCGCTCGG TCATGATTTC TGTGCGATCT 
GCGGCGAGCC AGTACTAAAG ACACGCTAGA 

4810 4820 4830 
TCATCACCCG GCGTCTCAGG CTGGCGGCGG 
AGTAGTGGGC CGCAGAGTCC GACCGCCGCC 

4870 4880 4890 
CGATCAGCAA GGCGCGGCCC TGGCAGCTCG 
GCTAGTCGTT CCGCGCCGGG ACCGTCGAGC 

4930 4940 4950 
TGCCGGCAAG CGTTCCGGTC ATCTTCGGCC 
ACGGCCGTTC GCAAGGCCAG TAGAAGCCGG 

4990 5000 5010 
CGGTGATGCC GCTCGGCGAG GCCGATGCCA 
GCCACTACGG CGAGCCGCTC CGGCTACGGT 

5050 5060 5070 
TCGGCTCGCC GGAGACGCGC ATCGTCGAGC 
AGCCGAGCGG CCTCTGCGCG TAGCAGCTCG 

5110 5120 5130 
CGCGCTTCTA TGCAGGGGCG AGCCAGTGAG 
GCGCGAAGAT ACGTCCCCGC TCGGTCACTC 

5170 5180 5190 
CGACCGTCGG CACGTCCGCG GGCTTGCGCC 
GCTGGCAGCC GTGCAGGCGC CCGAACGCGG 

5230 5240 5250 
GGCGCGCTGC GGCAATCTTG CCGTAGGTGG 
CCGCGCGACG CCGTTAGAAC GGCATCCACC 

5290 5300 5310 
CATCGATCTG CCGACTCCTG AGCAACGCGG 
GTAGCTAGAC GGCTGAGGAC TCGTTGCGCC 

5350 5360 5370 
CCAGGATCGC CTCCTGGTCG GGCAGATTAA 
GGTCCTAGCG GAGGACCAGC- CCGTCTAATT 

5410 5420 5430 
TGACGTAGCT GTGCTGCGGC GCGACCTCGA 
ACTGCATCGA CACGACGCCG CGCTGGAGCT 

5470 5480 5490 
GGAAGACGCG GCGTCGCCGA TCACCGAGCG 
CCTTCTGCGC CGCAGCGGCT AGTGGCTCGC 

5530 5540 5550 
CAGTCCAGCG GTCGCCAGGC AGGGGCACCC 
GTCAGGTCGC CAGCGGTCCG TCCCCGTGGG 

5590 5600 5610 
CGCCGGTTCT TTGCGCTGCG TCCGCGGCGT 
GCGGCCAAGA AACGCGACGC AGGCGCCGCA 

5650 5660 5670 
TCGCATC6AC CAGCAGCGCG ATGTTTTCGT 



4780 4790 480*0 
CGCTTTCCGA CAATCTGAAG CCCTGGGAAG 
gcga/aok:t GTTAGACTTC GGGACCCTTC 

4840 4850 4860 
AAGCGGGCTT CGTCATTGCC ctctacaatc 
TTCGCCCGAA GCAGTAACGG GAGATGTTAG 

490C 4910 4920 
GTGAGGCCTT CGAGCTTCTG CGCAGCGTTC 
CACTCCGGAA GCTCGAAGAC GCGTCGCAAG 

4960 4970 4980 
GTGCGGCCGG GCGGCCGGAC GAACGGATCG 
CACGCCGGCC CGCCGGCCTG CTTGCCTAGC 

5020 5030 5040 
ACCGCGCCGA CATGGCGACC TGCGTCATCA 
TGGCGCGGCT GTACCGCTGG ACGCAGTAGT 

5080 5090 5100 
GCGACGGCCA ACCCGATCTC GTCTACACAC 
CGCTGCCGGT TGGGCTAGAG CAGATGTGTG 

5140 5150 5160 
CGATGCGGTT GAGTGCCTCG TCGCAACTGC 
GCTACGCCAA CTCACGGAGC AGCGTTGACG 

5200 5210 5220 
GCTCGaCCAT GATCACCTCG ATGCCGAGCC 
CGAGCTGGTA CTAGTGGAGC TACGGCTCGG 

5260 5270 5280 
CGCTGCCACC GCTGTTCTTG GCGACGATCA 
GCGACGGTGG CGACAAGAAC CGCTGCTAGT 

5320 5330 5340 
CTTCGTCGGC TTCCOCAAAG GGACCGGTCG 
GAAGGAGCCG AAGGCGT.TTC CCTGGCCAGC 

5380 5390 . 5400 
GCGGCGGCGT CACCGGATCG ACGCTGCGGA 
CGCCGCCGCA GTGGCCTAGC TGCGACGCCT 

5440 5450 5460 
AGTGGAAAGC TTCCTGTCGA CCTATCGCCA 
TCACCTTTCG AAGGACAGCT GGATAGCGGT 

5500 5510 5520 
CGCTGACGGC CTCGACAACG CTATCGACAG 
GC6ACTGCCG GAGCTGTTGC GATAGCTGTC 

5560 5570 5580 
ATTCCGGTCG GCGGAGGGCG ATAAGCGCAA 
TAAGGCCAGC CGCCTCCCGC TATTCGCGTT 

5620 5630 5640 
TGTGCGAAAT GCGTGCGGCA AAGGGGTGCG 
acacgIitta CGCACGOCGT TTCCCCACGC 

5680 5690 5700 
CATGCACGAA ATGCGCCAGC CCATCGGCGC 
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AGCGTAGCTG GTCGTCGCGC TACAAAAGCA GTACGTGCTT TACGCGGTCG GGTAGCCGCG 

5710 5720 5730 5740 5750 5760 
CGCCAAAGCC GCCGATGCGC GTCTTGACCG GCTGCGGCCG CGGGTCCGCG GTGCGGCCGG 
GCGGTTTCGG CGGCTACGCG CAGAACTGGC CGACGCCGGC GCCCAGGCGC CACGCCGGCC 

5770 5780 5790 5800 5810 5820 
CCAGCGAGAT GGCGGTGTCG TAGCGGACAT CTTCGGCCAA GCGGCGCGCG AGTTCGCGTG 
GGTCGCTCTA CCGCCACAGC ATCGCCTGTA GAAGCCGGTT CGCCGCGCGC TCAAGCGCAC 

5830 5840 5850 5860 5870 5880 
CCTCGGTGGT GCCACCCAGA ATCAGAATAC GAGGTTTTTC CATGGCTGAC GTGTCGAACA 
GGAGCCACCA CGGTGGGTCT TAGTCTTATG CTCCAAAAAG GTACCGACTG CACAGCTTGT 

5890 5900 5910 5920 5930 5940 
GCGAACCCGC CATAGTCTCC CCCTGGCTGA CCGTCATCGG TATCGGTGAG GATGGTGTAG 
CGCTTGGGCG GTATCAGAGG GGGACCGACT GGCAGlS^GCC ATAGCCACTC CTACCACATC 

5950 5960 5970 5980 5990 6000 
CGGGTCTCGG CGACGAGGCC AAGCGGCTGA TCGCCGAAGC GCCGGTCGTC TACGGCGGCC 
GCCCAGAGCC GCTGCTCCGG TTCGCCGACT AGCGGQTTCG CGGCCAGCAG ATGCCGCCGG 

6010 6020 6030 6040 6050 6060 
ATCGTCATCT ggagctcgcc gcctccctca tcaccggcga agcgcacaat tggctaagcc 

TAGCAGTAGA CCTCGAGCGG CGGAGGGAGT AGTGGCCGCT TCGCGTGTTA ACCGATTCGG 
6070 6080 6090 6100 6110 6120 

ccctcgaacg ctcggtcgtc gagatcgtcg cgcgtcgcgg cagcccggtg gtggtgcttg 
gggagcttgc gagccagcag ctctagcagc gcgcagcgcc gtcgggccac caccacgaac 

6130 6140 6150 6160 6170 6180 

cctcgggcga cccgttcttc ttcggcgtcg gcgtgacgct ggcgcgccgc atcgcctcgg 

GGAGCCCGCT GGGCAAGAAG AAGCCGCAGC CGCAC^GCGA CCGCGCGGCG TAGCGGAGCC 

6190 6200 6210 6220 6230 6240 
CCGAAATACG CACGCTTCCG GCGCCGTCGT CGATCAGTCT TGCGGCCTCG CGCCTCGGCT 
GGCTTTATGC GTGCGAAGGC CGCGGCAGCA GCTAGTCAGA ACGGCGGAGC GCGGAGCCGA 

6250 6260 6270 6280 6290 6300 
GGGCGCTGCA GGATGCGACG CTCGTCTCCG TACATGGGCG GCCGCTGGAT CTGGTGCGAC 
CCCGCGACGT CCTACGCTGC GAGCAGAGGC ATGTACCCGC CGGCGACCTA GACCACGCTG 

6310 6320 6330 6340 6350 6360 
CGCATTTGCA TCCGGGGGCG CGTGTGCTTA CGCTCACGTC GGACGGTGCG GGTCCGCGAG 
GCGTAAACGT AGGCCCCCGC GCACACGAAT GCGAGTGCAG CCTGCCACGC CCAGGCGCTC 

6370 6380 6390 ' 6400 6410 6420 
ACCTTGCCGA GCTTCTGGTT TCAAGCGGCT TCGGTCAGTC GCGACTGACC GTGCTCGAAG 
TGGAACGGCT CGAAGACCAA AGTTCGCCGA AGCCAGTCAG CGCTGACTGG CACGAGCTTC 

6430 6440 6450 6460 6470 6480 
CGCTGGGCGG CGCCGGCGAA CGGGTGACGA CGCAGATCGC CGCGCGCTTC ATGCTCGGCC 
GCGACCCGCC GCGGCCGCTT GCCCACTGCT GCGTCjTAGCG GCGCGCGAAG TACGAGCCGG 

6490 6500 6510 . 6520 6530 6540 
TCGTGCATCC TTTGAACGTC TGCGCCATTG AGGTG6CGGC CGACGAGGGC GCGCGCATCC 
AGCACGTAGG AAACTTGCAG ACGCGGTAAC TCCACCGCCG GCTGCTCCCG CGCGCGTAGG 

6550 6560 6570 6580 6590 6600 
TGCCGCTTGC CGCCGGCCGC GACGATGCGC TGTTCGA^CA TGACGGGCAG ATCACCAAGC 
ACGGCGAACG GCGGCCGGCG CTGCTACGCG ACAAGCTTGT ACTGCCCGTC TAGTGGTTCG 

6610 6620 6630 6640 6650 6660 
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GCGAGGTGCG GGCGCTGACG CTGTCGGCAC TCGCACCGCG €AAGGGCGAA CTGCTATGGG 
CGCTCCACGC CCGCGACTGC GACAGCCGTG AGCGTGGCGC 6TTCCCGCTT 6ACGATACCC 

6670 6680 6690 $700 6710 6720 
ACATCGGCGG CGGCTCCGGC TCGATCGGCA TCGAA^GGAT GCTCGCCGAT CCGACCATGC 
TGTAGCCGCC GCCGAGGCCG AGCTAGCCGT AGCTTACCTA CGAGCGGCTA GGCTGGTACG 

6730 6740 6750 6760 6770 6780 
AGGCGATCAC CATCGAGGTT GAGCCGGAGC GGGCAGCGCG CAlCGGCCGC AACGCGACGA 
TCCGCTAGTG GTAGCTCCAA CTCGGCCTCG CCCGKGCGC GTAGCCGGCG TTGCGCTGCT 

6790 6800 6810 6820 ; 6830 6840 
TGTTCGGCGT GCCCGGGCTG ACGGTTGTCG AAGGCGAGGC GCCGGCGGCG CTTGCCGGCC 
ACAAGCCGCA CGGGCCCGAC TGCCAACAGC TTCC(^TCCG CG(^CGCCGC GAACGGCCGG 

6850 6860 6870 ;;6880 6890 6900 
TGCCACAACC GGACGCGATC TTCATCGGCG GCGGCGGCAG CGAAGACGGC GTCATGGAAG 
ACGGTGTTGG CCTGCGCTAG AAGTAGCCGC CGCCGCCGTC GCTTCTGCCG CAGTACCTTC 

6910 6920 6930 6940 6950 6960 
CAGCGATCGA GGCGCTCAAG TCAGGCGGAC GGCTGGTTGC CAACGCGGTG ACGACGGACA 
GTCGCTAGCT CCGCGAGTTC AGTCCGCCTG CCGACCAACG .GTTGCGCCAC TGCTGCCTGT 

6970 6980 6990 • 7000 7010 7020 
TGGAAGCGGT GCTGCTCGAT CATCACGCGC GGCTeGGOSG TTCGCTGATC CGCATCGATA 
ACCTTCGCCA CGACGAGCTA GTAGTGCGCG CCGAGCCdcC AAGQGACTAG GCGTAGCTAT 

7030 7040 7050 "7060 7070 7080 
TCGCGCGTGC AGGACCCATC GGCGGCATGA CCGGCIGGAA GCCGGCCATG CCGGTCACCC 
AGCGCGCACG TCCTGGGTAG CCGO:GTAC:r GGCCGACCTT CGGCCGGTAC GGCCAGTGGG 

7090 7100 7110 7120 7130 7140 
AATGGTCGTG GACGAAGGGC TAAAGCAGTT CCAGC®iAAG TGTGACGCGG TTTTGCGTCC 
TTACCAGCAC CTGCTTCCCG ATTTCGTCAA GGTC®2ferC AdicS'GCGCC AAAACGCAGG 

7150 7160 7170 7l80 7190 7200 
GGAACTGCGC AAGAAAAAGA AAGAGTAAQC TATGACGGTA CATTTCATCG GCGCCGGCCC 
CCTTGACGCG TTCTTTTTCT TTCTCATTGG ATACTQCCAT GTAAAGTAGC CGCGGCCGGG 

7210 7220 7230 7240 7250 7260 
GGGAGCCGCA GACCTGATCA CGGTGCGTGG TCGCGACCTG ATCGGGCGCT GCCCGGTCTG 
CCCTCGGCGT CTGGACTAGT GCCACGCACC AGCGCTGGAC TAGCCCGCGA CGGGCCAGAC 

7270 7280 7290 7300 7310 7320 
CCTTTACGCC GGCTCGATCG TCTCGCCGGA GCTGCTGCGA TATTGCCCGC CGGGCGCCCG 
GGAAATGCGG CCGAGCTAGC AGAGCGGCCT CGACGteGCT ATAACGGGCG GCCCGCGGGC 

7330 7340 7350 7360 7370 7380 
CATTGTCGAT ACGGCGCCGA TGTCCCTCGA CGAGATCGAG GCGGAGTATG TGAAGGCCGA 
GTAACAGCTA TGCCGCGGCT ACAGGGAGCT GCTCTAGCTC CGCCTCATAC ACTTCCGGCT 

7390 7400 7410 7420 7430 7440 
AGCCGAAGGG CTCGACGTGG CGCGGCTTCA TTCGGGCGAC CTTTCGGTCT GGAGTGCTGT 
TCGGCTTCCC GAGCTGCACC GCGCCGAAGT AAGCCCGCTG GAAAGCCAGA CCTCACGACA 

7450 7460 7470 7480 7490 7500 
GGCCGAACAG ATCCGCCGGC TCGAGAAGCA TGGCATCGCC TAIACGATGA CGCCGGGCGT 
CCGGCTTGTC TAGGCGGCCG AGCTCTTCGT ACCGTAGCGG ATATCCTACT GCGGCCCGCA 

f 

7510 7520 7530 ‘7540 .7550 7560 
TCCTTCCTTT GCGGCGGCGG CTTCAGGGCT CGGTCGCG?^ TTGA'GGATTC CGGCCGTGGC 
AGGAAGGAAA CGCCGCCGCC GAAGTCGCGA GCCAGeGCTT AACTGGtAAG GCCGGCACCG 
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7570 


7580 


7590 


GGAGAGGGTG 


GTGGTGAGGG 


GGGTTTGGGG 


GGTCTCGGAC 


CAGGAGTGGG 


GGCAAAGGCC 


7630 


7640 


7650 


GGTTTGGGGT 


TTGGGGGGTA 


GGGGATGGAG 


GGAAAGGGGA 


AAGGGGGGAT 


GGGGTAGGTG 


7690 


7700 


7710 


TGAGGAGGTG 


GTGGAGGAAG 


TGAGGGGGGT 


AGTGGTGGAG 


GAGGTGGTTG 


AGTGGGGGGA 


7750 


7760 


7770 


CGTCAAGGCC 


TCGTGGCCGG 


ACGAACGCGT 


GGAGTTGGGG 


AGGACGGGGG 


TGGTTGGGGA 


7810 


7820 


7830 


GAAGGTGGGG 


GAAGAGGGGA 


TGGAGGGCAG 


GTTGGAGCGG 


GTTCTGGGGT 


AGCTGGGGTG 


7870 


7880 


7890 


AGCCTGCGAT 


TTCCGTGAAA 


GCTCGCTCTA 


TCGGAGGCTA 


AAGGCACTTT 


CGAGCGAGAT 


7930 


7940 


7950 


GGGGGGGGAA 


TAGGCGGGAG 


TGGCTGGGGG 


GGGGGGGGTT 


ATGGGGGGTG 


AGGGAGGGGG 


7990 


8000 


8010 


TGAAAGGTAT 


TGTGGGGGTT 


GTTGGGGGGG 


ACTTTGGATA 


AGACGGCCAA 


GAAGCGCGCC 


8050 


8060 


8070 


TTGGTGGAGG 


GGGTGGCGGT 


AGAGGGGTGC 


AAGGAGGTGG 


GGGAGGGGGA 


TGTGGGGACG 


8110 


8120 


8130 


GGTGGGGAGG 


AGGAAGAGGA 


TGATGAGGAT 


GGAGGGGTGG 


TGGTTGTGGT 


AGTAGTGGTA 


8170 


8180 


8190 


GGCAAAGGAG 


ATGATAGAGG 


GGGGGCAGAT 


GGGTTTGGTG 


TAGTATGTGG 


GGGGGGTGTA 


8230 


8240 


8250 


GGGTGGGTGG 


AGGGGGTGGT 


AGAAGGTGGT 


GGGAGGGAGG 


TGGGGGAGGA 


TGTTGGAGGA 


8290 


8300 


8310 


GGGGAGTGGG 


GGGGGGAGGA 


GGGTGAGGGG 


GGGGTGAGGG 


GGGGGGTGGT 


GGGAGTGGGG 


8350 


8360 


83l0 


GTGGGTGAGG 


TGGCTGATTG 


GATGATGTCC 


GAGGGAGTGG 


AGGGAGTAAG 


GTAGTAGAGG 


8410 


8420 


8430 


GAGGAGAGGA 


AGCGGATGAA 


AGGGAGGATC 


CTGGTGTGGT 


TCGGGTAGTT 


TGGGTGCTAG 


8470 


8480 


8490 


GTGCGGATGC 


CGAAGGTCAA 


GAGCATCAGC 


CACGCCTAGG 


GCTTCGAGTT 


CTCGTAGTCG 



7600 7610 7620 

CCGCGCCTCG CCGATGCCGA ACTCAGAAAC 
GGCGCGGAGC GGCTACGGCT TGAGTCTTTG 

7660 7670 7680 

GCTGGCAATC CACCTTGCGA TCCATGCGCT 
CGACCGTTAG GTGGAACGCT AGGTACGCGA 

7720 7730 7740 

CTACGGTGCG GACTGCCCGG TCGCCATCGT 
GATGCCACGG CTGACGGGCC AGCGGTAGCA 

7780 7790 7800 

GGTGCGCGGC ACGCTCGGTG ACATCGCCGC 
CCACGdGCCG TGCGAGCCiAC TGTAGCGGCG 

■ 7840 7850 7860 

GGCGCTGATC TTCGTCGGTC CGGGGCTCGA 
ccgcgaGtag AAGCAGCCAG GCCCCGAGCT 

7900 7910 7920 

CGATCCCGCC TATCAGCGGC GCTTCAGAGG 
GCTAGGGCGG ATAGTCGCCG cgaagtctcc 

7960 7970 7980 

GTCGGCCTAA GTTTCCCGCT GAGAGGGTTT 
CAGCCGGATT CAAAGGGCGA CTCTCCCAAA 

8020 8030 8040 

CGGCCGCTGC TTGAGCGGGA CGCCGCGCTT 
GCCGGCGACG AACTCGCCCT GCGGCGCGAA 

8080 8090 8100 

CTGTCCT^C AGCATCAGCG TCACCGGCGT 
GACAGGTTCG TCGTAGTCGC AGTGGCCGCA 

8140 8150 8160 

TTCGTGGAAT ACCCAGCGGC TCTGCAGCAC 
AAGCACCTTA TGGGTCGCCG AGACGTCGTG 

8200 8210 8220 
CAtCAGTACG CCGCCGCTGG TCGCCAGCGT 
GTAGTCATGC GGCGGCGACC AGCGGTCGCA 

8260 8270 8280 

GAACCGGAGC AAGCGGACGG AGGCGATCAG 
GTTGGGCTGG TTGGGGTGGG TGGGGTAGTG 

8320 8330 8340 

GGAGAGGAGA AGGGGTGGGG AGAGGGGAAG 
GGTGTGGTGT TGGGGAGGGG TGTGGGGTTG 

8380 8390 8400 

GGGGGGATCA GGAAGTTGGG GAAGGGGATG 
GGGGGGTAGT GGTTGAACGG GTTGGGGTAG 

-8440 8450 8460 

AGGGGG^GT CGAAATAGAG GGAGTTGGGG 
rCCCGCCTGA GGTTTATCTG ggtgaagggg 

.8500 8510 8520 

atggcgttga tatagagcgt gtcgaggggg 

TACCdGAACT ATATGTCGCA CAGGTCGGGG 
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8530 8540 8550 
AGGATACGGT CCTGGGCGCG CGGTCCCCTC 
TCCTATGCCA GGACCCGCGC GCCAGGGGAG 

8590 8600 8610 
AGGCCGAGCA TGATCTGGGC AATCAGGATC 
TCCGGCTCGT ACTAGACCCG TTAGTCCTAG 

8650 8660 8670 
ATATCTCCTT CAGGGCGGTC TCATAGCGCT 
TATAGAGGAA GTCCCGCCAG AGTATCGCGA 

8710 8720 8730 
CCATGTCGAG CACGTGGAAG AGCAGGGACT 
GGTACAGCTC GTGCACCTTC TCGTCCCTGA 



;?8560 8570 8580 

ACCAT(?CeAT AGAAGGCAAA AGCCATCGCC 
TGGT'MGCTA TCTTCCGTTT TCGGTAGCGG 

8620 8630 8640 

GACCAGATGA TTGAAAGTTC CATCATCCGA 
CTGGTCTACT AACTTTCAAG GTAGTAGGCT 

8680 8690 8700 

TGACCGIAiC GAGCCAGATG TCCTCGTTCT 
ACTGGCATAG CTCGGTCtAC AGGAGCAAGA 

8740 8750 8760 

TGCGGCCGCG ATCCGGGGAA TTC 
ACGCCGGCGC TAGGCCCCTT AAG 
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. 25 / iSi 

SEQUENCE : FRRBnENT DE 559? BP DE >1800 R 3400 LONGUEUR ■ >»60^ 



PHRSE 



PHRSE 



PHRSE 



BC 



BC 



BC 




R>RTG 
• STOP 

BC BRIN CONPLENENTRIRE 



PHASE OtJVERTE 3 



FIGURE 9.3 



FEUILLE DE-HEMPLACtMENT 
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26 /4Si 



SEQUENCE : FRAGMENT 0ES59^ BP DE 3000 A 45(00 LONGUEUR ■ ^50^ 





BC BRIN COMPLEMENTAIRE 



FIGURE 9. A 



FEUILLE DE REMPLACEMENT 
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27 /4SA 




me 1239 1359 1479 1599 1719 1939 1959 2979 




BC BRIN CONPLENENTRIRE 






ft 



9 



R 



R 



R 



R 



FIGURE 9.5 



FSUILLE DE JREMPLAC5M£NT 
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2 B/ /i I 



, SEQUENCE : FRRGNENT DE 8753 BP DE 650 fl 1650 LONGUEUR » 1001 





phase OUYERTE 6 



R-RTG 
* STOP 

BC BRIN CONPLENENTRIRE 

FIGURE 10.1 



FEUILLE K REWIPIJVCEMENT 
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PHASE 1 



PHASE 2 



PHASE 3 



BC 

PHASE 1 



BC 

PHASE 2 



BC 

PHASE 3 



. 29^/r/ 



SEQUENCE : FRAGNENT DE 8753 BP DE 1400 R 3100 LONGUEUR « 1701 




♦ 



fl 



R 

R 




R*RTG 
♦ STOP 

BRIN COriPLEttENTRIRE 



PHASE OUYERTE 7 



FISURE 10.2 



FEUILLE DE REMPLACEMENT 
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PHRSE 1 



PHRSE 2 



PHRSE 3 



BC 

PHRSE 1 



PHRSE 2 
BC 

PHRSE 3 



PL. 30j/ff 



SEQUENCE :FfM»GNENT DE 8753 BP DE 2700 ft 3700 LONCUEUR ■ 1001 





fi»RTC 
* STOP 

BC BRIN CONPLENENTRIRE 

.FIGURE 10.3 



FEUILLE DE REMPLACEMENT 
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PL. nJlS I 



SEQUENCE : FRRGNENT DE B753 BP DE 3500 R 4500 LONCUEUR « 1001 



PHRSE 1 


i 


/ 


GTG<3531> 




"V 




V. 4366<T0A> 

A 


• 




L 


_Z_ 














PHASE 2 




1 

■ 


1 1 


1 

_ rv 


A 


■ A. 




R 

* 


PHRSE 3 


r 


« 




, A 


1 


II 1 


1 


R 

* 

a 






3599 


3699 3799 


3899 


3999 


4090 4199 


4299 4399 


n 




PHASE OUYERTE 9 



FIGURE 10.4 

R-RTO 
• STOP 

BC BRIN CONPLEHENTRIRE FIGURE 10 4 



FEUILLE DE REMPLACEMENT 
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PHASE 1 



PHASE 2 



PHASE 3 



BC 

PHASE 1 



BC 

PHASE 2 



BC 

PHASE 3 



PL. 32^/i- I 



SEQUEMCE : FRRBtlENT DE B753 BP OE 415® R 5150 LONCUEUR « 1001 





PHASE OUYERTE 10 



ft»RTC 
• STOP 

BC BRIN CONPLEKENTRIRE 

FIGURE 10.5 



FEIJLLE 1^ REMPL^EMENT 
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SEQUENCE : 253T0T DE 5000 R 6000 LONGUEUR = 1001 





PHASE OUYERTE 1 1 

- I 

FtjrUAB lO'i 

FEUlLui DE REMPLACEMEMT 
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PHASE 1 



PHASE 2 



PHASE 3 



BC 

PHASE 1 



P^E 2 



BC 

PHASE 3 



PL. iujlCf 



SEQUENCE : FAAGNENT DE 8753 BP DE 5700 A 7200 LONCUEUA * 1501 




A 




PHASE OUYERTE 12 



H»ATC 
* STOP 

BC BA I H CONPLEtlEHTA IRE FI CURE 10.7 



FEUILLE DE REN/5PLACEMEMT 






wo 91/11518 



PCT/FR91/00054 



PHASE 1 



PHASE 2 



PHASE 3 



BC 

PHASE 1 



BC 

PHASE 2 



BC 

PHASE 3 



PL. /. 




PHASE OUVERTE 13 



n«flTG 
* STOP 

BC BRIN CONPLEtlENTRIRE FIGURE 10 6 



F^tLE bHBEMPU^CEME^^ 

■ . ■ X]. • 




EJuUm tfn r^ffmtnl EctRI-ll(iitflll 
kb 
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9 





SC510 Rif^ 
6572. 6643 
6634 

PXL545Q 

pXLISOO 

PXL1397 

PXL302 

PXL723 



CObE 

ORF1 




FIGURE 12 






Elution du ft'ogment Ecc 
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39 



/•feri 






o> 



..00 

CM 

coH 






+ + + + 
+ 4“ + + 


f^i 


+ + ^ 

+ + « 


+ + + + 


1 


+ + -5 


+ +. + + 


1 


+ + o 


4* + + + 


1 


+ + ^ 


+ + + + 


1 


+ + 


-f + + + 


1 


+ + 




in 

o> 

or- 



co 

o>- 







CM CM 

Oil “ 

CoP N“^ 
0> 



00 

O) 



HCMCn^lOVOt^OO 



++++++++ 



++++++++ 

++++++++ 

++++++++ 



t + +J:liJ++ + 
+ + +[tl“++-i^ 



+ + 



+ + + + 4 - 



+ + LJ+ + ++ + 

+ [I|+ + + ++ + 




+ + + + ++ + 

+ + + + ++ + 
+ + + + ++ + 




+ + + + + ++ [fj 

+ + [n+ + ++ + 



iu + + + + ++ + 
+ + + + + + 
+ + + -H + + + + 



+ + + + ++ + + 



+ +=+ + + ++ + 



Ml 



^1^ 



«|6 



.o 

o 

u 



s 

o 



s 



H 

H 

» 

n- 

n 



H H 
H g , 



8 t(5 



H 
H 

^ H 



I 

H 



FIGURE 14 
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GENE £fiba ET PROTEINE COBA 

SEQUENCE DU FRAGMENT Clal-Hlndlll -Hln^ II -Hindl ll DE 5396 BP, DE 1141 A 1980 

1141 1151 1161 1171 -J' 1181 1191 12Q1 

1216 1226 1236 1246 1256 1266 1276 



1 •> Q^^^^^n^^^’^^^^^^^^^^^^^^^^^^^^i^GTTTGCGGGCAAGCGTGGCGG^GCTOTCG 
X ^321 1331 1341 . 1351 

. r}^^t ^396 -],406 m6 1426 

1441 1451 1461 1471 ' ? 1481 1491 1501 

1516 1526 1536 1546 '-i;556 



1566 



1576 



1591 



1666 



1741 






1601 



1611 



1621 



1631 



1641 



1651 



1676 1686 1696 • 1706 - l7l6 

roGlnC 

CGCAGC 

1751 1761 : 1771 ' *f781 . 1791 



1726 

Valle 

GTGCl 

1801 



1816 1826 1836 1846 ' 1856 18'66 1876 

1891 1901 1911 1921 ' 1931 1941 

LeuArgAsnProAla* * * 

CTCAGGAACCCGGCATGA 
1966 1976 1986 1996 



2006 



2016 



1951 

2026 



FIGURE 15.1 




wo 91/11518 



PCT/FR91/000S4 



KCW = COBA 






PREMIER RESIDU = 1 

DERNIER RESIDU = 280 



NOIBRE 

1 PHE F 8 

2 LEU L 31 

3 ILE I 16 

4 MET M 4 

5 VAL V 27 

6 SER S 8 

7 • PRO P 19 

8 THR T 10 

9 ALA A 41 

10 TYR Y 2 

11 * * 0 

12 HIS H 7 

13 GLN Q 6 

14 ASN N 9 

15 LYS K 8 

16 ASP D 15 

17 GLU E 13 

18 CYS C 2 

19 TRP W 3 

20 ARG R 19 

21 GLY G 32 

22 - - 0 



RESIDUS s 280 

POIDS MOLECULAIRE » 29234. 

INDEX DE POLARITE (%^ i 34 1 

POINT ISOELECTRIQUE = 7.51 

DO 260 (Img/ml) = 0.464 DO 280 (Img/ml) 



% NQMB 


POIDS 


% POIDS 


2.86 


1176.56 


4.02 


11.07 


3505.48 


11.99 


5.71 


1809.28 


6.19 


1.43 


524.16 


1.79 


9.64 


2674.89 


9.15 


2.86 


696.24 


2.38 


6.79 


1843.95 


6.31 


3.57 


1010.50 


3.46 


14.64 


2912.64 


9.96 


0.71 


326.12 


1.12 


0.00 


0.00 


0.00 


2.50 


959.42 


3.28 


2.14 


768.36 


2.63 


3.21 


1026.36 


3.51 


2.86 


1024.72 


3.51 


5,36 


1725.45 


5.90 


4.64 


1677.52 


5.74 


0.71 


206.02 


0.70 


1 .07 


558.24 


1.91 


6.79 


2965.90 


10.15 


11.43 


1824.64 


6.24 


0.00 


0.00 


0.00 



0.652 



PROFIL D'HXDROPHIUCITE DE lA PROTEINE CXIBA 

coBfl OE in 2»e 
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GENS cobB ET PROTEINS COBB 

SEQUENCE DU FRAGMENT Cla l -Hlndl ll -Hlndl ll -Hlndl TT DE 5396 BP, DE 1980 A 3281 

MetSerGlyLeijLeuIleAlaAlaProAlaSerGlySerGlyLysThtThrValThrLeuGlyLeuMetArgAla 

atgagcggattgctgattgccgcacccgcgtccggctccggcaagacgacsgtgacgctcgggctgatgcgcgcc 

1980 1990 2000 2010 2020 2CP0 2040 

LeuLysArgArgGlyValAlalleAlaProGlyLysAlaGlyProAsplVrlleAspProAlaPheHisAlaAla 

ctgaagaggcgcggcgtggcgatcgcgcccggcaaggcggggccggactatatcgatcccgctttccacgcggca 

2055 2065 2075 2085 2095 2105 2115 

AlaThrGlyGluProCysPheAsnTyrAspProTipAlaMetArgProGluLeuiLeuLeuAlaAsnAlaSerHis 

gcgaccggcgagccctgcttcaactacgacccctgggcgatgcgcccggaactgctgcttgccaatgcgtcgcat 

2130 2140 2150 2160 2170 2180 2190 

valAlaSerGlyGlyArgThrLeuIleValGluAlaMetMetGlyLeuHisAspGlyAlaAlaAspGlySerGly 

gtggcctccggcgggcgcacattgatcgtcgaggcgatgatgggactgcatgacggtgctgccgacggctcggga 

2205 2215 2225 2235 2245 2255 2265 

ThrProAlaAspLeojAlaAlaThrLeuAsnLeuAlaVallleLeuValValAspCysAlaArgMetSerGlnSer 
acgccagcggacctcgccgcgacgctgaaccttgcGgtcattctggtggtcgattgcgcccgcatgtcccagtcg ■ 

2280 2290 2300 2310 2320 2330 2340 

ValAlaAlaLeuValArgGlyTyrAlaAspHisAr^ki^splleArgvalValGlyVallleLeuAsnLysVal 

gttgccgccctcgtgcgcggctatgcggatcatcgc^cgatatccgggtggttggcgtcatcctcaacaaggtc 

2355 2365 2375 2385 2395 2405 2415 

GlySerAspArgHisGluMetMetLeuArgAspAlaLeuGlyLysValArgMetProValPheGlyValLeuAro 

ggcagcgatcggcatgaaatgatgctgcgcgatgcgctcggcaaggtgcgcatgcctgtcttcggcgtgctccgg 

2430 2440 2450 2460 2470 2480 2490 

GlnAspSerAlaLeuGlnLexiProGluArgHisLeuGlyLeuValGlnAlaGlyGluHisSerAlaLeuGluGlv 

caggacagcgcattgcaactgccggagcgccatctcgggctcgtgcaggcgggcgaacactcagcgcttgagggc 

2505 2515 2525 2535 2545 ' 2555 2565 

PhelleGlvoAlaAlaAlaAlaArgValGluAlaAlaC^sAspLeuAsp^alleArgLeuIleAlaThrllePhe 

ttcatcgaggcggcggccgcgcgggtcgaggctgcctgcgatctcgacgccatccgcctgatcgcgacgattttc 

2580 2590 2600 2610 2620 2630 2640 

ProGlnValProAlaAlaAlaAspAlaGluArgLeuArgProLeuGlyGlnArglleAlaValAlaArgAsplle 

ccgcaggtgcccgcggcggccgatgccgagcgtttgcggccgctcggtcagcgcatcgcggtcgcgcgcgatatc 

2655 2665 2675 2685 2695 2705 2715 

AlaPheAlaPheCysTyrGluHisLeuLeuTyxGlyiipArgGlnGlyGlyAlaGluIleSerPhePheSerPro 

gcctttgccxtctgctacgagcacctgctttacggctggcggcaaggcggcgcggagatttccttcttctcgccg 

2730 2740 2750 2760 2770 2780 2790 

LeuAlaAspGluGlyProAspAlaAlaAlaAspWaValTyrLeuProGlyGlyTyrProGluLeuHisAlaGly 

ctcgccgacgaggggccggatgcggcagccgatgccgtctatcTtccggggggttatccggagctgcatgcgggg 

2805 2815 2825 2835 2845 2855 2865 

GItiLguS© rAl 3A1 sAl sAr^fPhsAr^SBxGlyMst Hi s SorAl aAl siGluAirgGlyAl l6Ph6Gl vGlu 

cagctgagcgccgccgcccgattccgttccggcatgcattccgcggcggaacgcggcgcccgcatcttcggcgag 

2880 2890 2900 2910 2920 2930 2940 

CysGlyGlyTyrMetValLeuGlyGluGlyLeuValAlaAlaAspGlyThrArgTyrAspMetLeuGlyLeuLeu 

tgcggcggctatatggtgctcggcgaagggcttgtggctgccgatggcacacgctacgacatgctcggcctgctg 

2955 2965 2975 2985 . 2995 . 3005 3015 

ProLeuValThrSerPheAlaGltiArgArgArgHisLeuGlyTyrArgArgValValProValAspAsnAlaPhe 
CCGCTCGTAACCAGTTTTGCCGAGCGCAGGCGGCACCTCGGCTATCGCCGCGTCGTGCCTGTCGACAACGCCTTC 
3030 3040 3050 3060 > 3070 3080 3090 

PheAspGlyProMetThrAlaHisGluPheHisTyiAlaThrlleValAlaGluGlyAlaAlaAspArgLeuPhe 

ttcgatggacccatgacggcgcacgaattccactat(Scgaccatcgtcgccgaaggggcggccgatcggctgttt 

3105 3115 3125 3135 > 3145 3155 3165 

AlaValSerAspAlaAlaGlyGluAspLeuGlyGlnAlaGlyLeuAr^gGlyProValAlaGlySerPheMet 

gcggtcagcgacgccgccggcgaggatctcggccagojgggcctccggcgcggccctgtcgccggttccttcatg 

3180 3190 3200 3210 3220 3230 3240 

HisLeuIleAspValAlaGlyAlaAla*** 

CATCTGATCGACGTCGCAGGTGCTGCATGA 

3255 3265 3275 3285 3295 3305 3315 



FIGURE 15.3 
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'h2>j4H. 




NOM 


« COBB 




PREMIER RESIDU « 


1 










DERNIER RESIDU = < 


434 










NOMBRE 


% NOMB 


POIDS 


% POIDS 


1 


PHE 


F 


17 


3.92 


2500.19 


5.47 


2 


LEU 


L 


45 


10.37 


5088.60 


i:.i4 


3 


ILE 


I 


17 


3.92 


1922.36 


4.21 


4 


MET 


H 


14 


3.23 


1834.56 


4.02 


5 


VM. 


V 


31 


7,14 


3071.17 


6.72 


6 


SER 


S 


19 


%:38 


1653*57 


3.62 


7 


PRO 


P 


21 


4; 84 


2038.05 


4.46 


8 


THR 


T 


12 


2.76 


1212.60 


2.65 


9 


ALk 


A 


76 


17.51 


5399.04 


11.82 


10 


TCR 


Y 


11 


2.53 


1793.66 


3.93 


11 


* 


♦ 


0 


b.oo 


0.00 


0.00 


12 


HIS 


H 


14 


3.23 


1918.84 


4.20 


13 


GLN 


Q 


9 


2.07 


1152.54 


2.52 


14 


ASN 


N 


5 


1.15 


570.20 


1.25 


15 


LYS 


K 


5 


1.15 


640.45 


1.40 


16 


ASP 


D 


28 


6.45 


3220.84 


7.05 


17 


GLU 


£ 


21 


4.84 


2709.84 


5.93 


18 


CYS 


C 


5 


1.15 


515.05 


1.13 


19 


TRP 


w 


2 


0.46 


372.16 


0.81 


20 


ARG 


R 


34 


7.83 


5307.40 


11.62 


21 


GLY 


G 


48 


11.06 


2736.96 


5.99 


22 




— 


0 


0.00 


0.00 


0.00 




PESIDUS 




- 434 








POIDS MC^CULAIRE 


= 45676. 








INDEX DE POLARITE (%) 


“ 34. 








POINT ISOELECTRIQDE 


= 6.47 








DO 260 


(Img/ml) = 0. 


351 DO 280 


(Irog/ml) 


>= 0.529 
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GENE CQbC ET PROTEINE COBC 

SEQUENCE DU FRAOIENT Cla l -Hlndl ll -HlrtpJ I -Hlndl ll DE 5396 BP, DE 13281 A 4279 

MetSerAlaProIleValHisGlyGlyGlyllethtGluAlaAlaAlaArgTyrGlyGlyArgProGluXspTrp 
ATGAGCGCACCGATCGTTCATGGTGGCGGCATCAtC^GGCCGCAGCGCGCTATGGCGGCCGGCCTGAAGACTGG 
3281 3291 3301 3311 ;3321 3331 3341 

LeuAspLeuSerThrGly lleAsnProCys#iroValAlaLe\iProAlaValProGluArgAl aTrpHi sArgLeu 
CTCGATCTGTCGACCGGCATCAATCCATGCCGCGTCGCCTTGCCCGCGGTCCCTGAGCGCGCCTGGCACCGGCTG 
3356 3366 3376 3386 3396 ,3406 3416 

ProAspArgGlnThrValAspAspAlciArgSerAlaAlaAlaAspTyrTyrArgThrAsnGlyValLexiProLeu 
CCGGATCGGCAGACGGTAGATGATGCGCG6AGCGCCGCCGCCGACTACTACCGCACCAACGGCGTGCTGCCTTTG 
3431 3441 3451 3461 ^471 3481 3491 

ProValProGlyThrGlnSerVaQlleGlnLeULeupioArgLexjAlaProAlaAsnArgHisValAlallePhe 
CCGGTGCCGGGCACCCAGTCGGTGATCCAGCTCCTGCSGACGTCTtGCTCCGGCCAACAGGCACGTCGCGATTTTC 
3506 3516 3526 3536 3546 3556 3566 

GlyProThrTyrGlyGluTyrAlaArgValLeuGluAlaAlaGlyPheAlaValAspArgValAlaAspAlaAsp 
GGGCCGACCTATGGCGAGTATGCCCGCGTGCTTGAAGCGGCCGGCTTTGCTGTCGATCGCGTCGCGGATGCCGAC 
3581 3591 3601 3611 ; 3621 . 3631 ' 3641 

AlaLeuThrAlaGluHisGlyLeuVallleValValAsnProAsnAsnProThrGlyArgAleiLeuAlaProAla 

gcgctcacggccgaacatgggcttgtcatcgtcgtcaaccccaacaacccgaccggccgggccttggcgccggcg 

3656 3666 3676 3686 ;3£96 3706 3716 



gagcttctggcgatcgccgcaaggcagaaggcgagCggcggactgctgctggtcgatgaggccttcggcgatctt 

3731 3741 3751 3761^ ^^3771 37^1 3791 



gagccgcaactgagtgtcgctggtcacgcgtcagggcaaggcaacc^catcgtcttccgctccttcggcaagttc 

3806 3816 3826 3836 3846 3856 3866 



!U 



TTCGGCTTTGCGGGCCTGCGCCTCGGCTTCGTCiTTGCGACeGAGCCACTGCTTGCATCCTTTGCCGATTGGCTC 
3881 3891 3901 3911 3921 3931 3941 



GlyProTrpAlaValSerGlyProAlaLeuThrlleSerLysAlaLeuMetGlnGlyAspThrLysAlalleAla 
GGTCCCTGGGCTGTCTCCGGCCCGGCGTTGACGATCTCGAAAGCGCt^TGCAGGGCGATACGAAGGCGATCGCG 
3956 3966 3976 3986 3996 4006 4016 

AlaGlylleLeuGluArgArgAlaGlyLeuAspAlaJ^aLeuAspGlyAlaGlyLeuAsnArglleGlyGlyThr 

GCGGGCATCCTCGAGCGTCGCGCCGGCCTCGATGCGGelCTCGATGGGGeAGGGCTCAACCGTATCGGCGGCACG 

4031 4041 4051 4061 4071 ; ipSl 4091 

GlyLeuPheValLeuValGluHisProArgAlaAlaLauL6uGlriGluArgLeuCysGl\jAlaHisIleLeuThr 
GGGCTATTCGTGCTGGTCGAGCATCCGAGGGCAGCTClGCTGCAGGAGCGGCTCTGCGAGGCCCATATTCTCACG 
4106 4116 4126 4136 4146 - 4156 4166 

ArgLysPheAspTyrAlaProThrTrpLeuArgfValGiyLeuAlaProAapAlaAlaGlyAspArgArgLeuAla 

cgcaagttcgactatgccccgacctggctcagggtcggtcttGcgcct^cgcggctggtgaccgacggctggcg 

4181 4191 4201 4211 4221 4231 4241 

AspAlaLeuAlaArgMetGliiLeu*** 

GACGCGCTTGCCCGCATGGAGCTCTGA 

4256 4266 4276 4286 4296 4306 4316 



FIGURE 15.5 
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z,r/<l5-d 

NOM = COBC PREMIER teSIDU » 1 

DERNIER RESIDU = 333 









NCB4BRE 


% NOME 


POIDS 


% POIDS 


1 


PHE 


P 


11 


3.30 


1617.77 


4.62 


2 


LEU 


L 


43 


12.91 


4862.44 


13.90 


3 


HE 


I 


13 


3.90 


1470.04 


4.20 


4 


MET 


M 


3 


0. 90 


393.12 


1.12 


5 


• VAL 


V 


24 


7.21 


2377.68 


6.79 


6 


SER 


S 


11 


3.30 


957.33 


2.74 


7 


PRO 


P 


23 


6.91 


2232.15 


6.38 


8 


THR 


T 


14 


4.20 


1414.70 


4.04 


9 


ALA 


A 


56 


16.82 


3978.24 


11.37 


10 


TYR 


y 


6 


,1.80 


978.36 


2.80 


11 


★ 


* 


0 


d.oo 


0.00 


0.00 


12 


HIS 


H 


7 


2.10 


959.42 


2.74 


13 


GLN 


Q 


8 


2.40 


1024.48 


2.93 


14 


ASN 


N 


8 


2.40 


912.32 


2.61 


15 


LYS 


K 


5 


1.50 


640.45 


1.83 


16 


ASP 


D 


19 


5.71 


2185.57 


6.25 


17 


GLU 


£ 


15 


4.50 


1935.60 


5.53 


18 


CYS 


C 


2 


0.60 


206.02 


0.59 


19 


TRP 


W 


5 


1.50 


930.40 


2.66 


20 


ARG 


R 


25 


7.51 


3902.50 


11.15 


21 


GLY 


G 


35 


10.51 


1995.70 


5.70 


22 


■ 


* 


0 


0.00 


0.00 


0.00 




RESIDUS 




= 333 








POIDS MOLECULAIRE 


» 34992. 








INDEX 


DE 


POIARITE (%) 


= 34. 







POINT ISOELECTRIQUE « 6.72 

DO 260 (Img/ml) = 0.670 DO 280 (Img/ml) « 0.998 



PROPIL D'HYDROPHILICITE DE lA PBOTEIME 

COBC DE 1 fl 333 
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GENE cobD ET PROTEINE COBD V v; 

SEQUENCE DU FRA04ENT glal-Jilndlll-fllntkll -H't nriT TT DE 5396 BP, DE 4284 A 5252 

MetSerGluThrlleLeuLeulleLeuAlaLeuAlaLeuVallleAspArgfValValGlyAspProAspTrpLeu 

GTGTCGGAGACGATCCTGCTCATTCTCGCGCTGGCGeTGGTGATCSlCCGCGTTGTCGGCGATCCGGACTGGCTC 

4284 4294 4304 4314 4324 4334 4344 

!^^9ValProMsProValValP^eGlyLysAlalleGlyPhePheAspAlaArgLeuAsnArgGlu 

TGGGCGCGCGrGCCGCATCCGGTO;TGTTTTTCGGGAAGGCCATCGGCTITrrCGACGCGCGGCTGAACCG^G 

4359 4369 4379 4389 4399 4409 4419 

^fSi«!i®^'^®®^^^®^9l'ysPheArgGlyValValAlallfeLeuLeuLeuLeuGlylleSerAlaTrpPhe 

GACCTCGAGGATAGCGCGCGCAAATTTCGTGGCGTCGTCGCGATCCTTrrGTTGCTTGGCATCAGCGCCTGGTTC 

4434 4444 4454 4464 4474 4484 4494 

GlyHlsLeuLeuHisArgLeuPheAlaV&lLeuGlyProLeuGlyPheLeuLeuGluAlaValLeuValAlaVal 

GGCCATCTGCTGCATCGCCTGTTCGCCGTCCTCGGACCGCTCGGCITPC'IGCTCGAGGCGGTTCTGGTCGCGGTC 

4509 4519 4529 4539 4549 4559 4569 

PheLeuAlaGlnLysSerLeuAlaAspHisValArgArgValAlaGlyGlyLeuArgGlnGlyGlyLeuGluGlv 

4584 4594 4604 4614 4624 : 4634 4644 

GlyAr^U-aAlaValSerMetlleValGlyArgAspProLysl^LeuAspGluProAlaValCvsAraAlaAla 

4659 4669 4679 4689 4699 4709 4719 

lleGluSerLeuAlaGluAsnPheSerAspGlyValValAlaProAlaPheTrpTyrAlaValAlaGlvLeuPro 
ATCGAAA^CraGCCGAGAATTTCTCCGACGGCGTCGT(^GCCGGC,CITCTGGTACGCGGTTGCCGGCCTGCCG 

4754 4764 4J74 .j4784 4794 



4734 



4809 4819 4829 4839 4849 ,.4859 4869 

SiXHS^®®®^^®^^^’^®P^P^"^^5'’¥'®J^oW.a^aArgi>euSerlleLeuLeulleSerAla 

^TGGGC^GGCCCGACTCGACGATCTCGCCAACChJGCCGGCAGCGRGGCTCTCGATCCTTTTGATCTCAGCC 

4894 4904 4914 4924 4934 4944 



4884 



4959 



4969 



4979 



4989 



4999 ^'i5009 



5019 



5034 5044 5054 5064 5074 5084 5094 

Sfi^iX3iXY®^^y®'^®^®®*^^"^^°“®^^^®^®^®^y^'®®^yArgAlaValAlaThrSerGluAsplleAsp 

TATGGCGGCGTCAAGGTCAGCGAACCTATGATCAACGGTCCGGGCCGAGCGGTTGCAACAAGCGAAGAttTCGW 

5109 5119 5129 5159 5149 5159 5169 

AlaGlylleAlaVal PheT yrGlyAlaCysThrValMetAlaGlyPheValLenAlalleAiaMetlle*** 

GCCGGTATTGCTGTATTTTATGGCGCCTGIACGGTCATGGCCGGGTTTGTTCTTGCAATCGCAATGATTTGA 

5184 5194 5204 5214 '5224 5234 5244 



FIGURE 15.7 
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NOl 


= COBD 




PREMIER i^SIDU 


» 1 










DERNIER :#SIDU 


« 323 










NC»4BRE 


; % : 


POIDS 


% POIDS 


1 


PH£ 


F 


14 


• 4.33 


2058.98 


6.02 


2 


LEU 


L 


45 


13.93 


5088.60 


14.89 


3 


ILE 


I 


18 


■5.57 


2035.44 


5.96 


4 


MET 


M 


8 


2.48 


1048.32 


3.07 


5 


VAL 


V 


27 


8.36 


2674.89 


7.83 


6 


• SER 


S 


17 


5.26 


1479.51 


4.33 


7 


PRO 


P 


15 


4.64 


1455.75 


4.26 


8 


THR 


T 


6 


1.86 


•606.30 


1.77 


9 


ALA 


A 


51 


15.79 


3623.04 


10.60 


10 


TYR 


Y 


5 


'1.55 


815.30 


2.39 


11 


* 


-k 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


9 


2.19 


1233.54 


3.61 


13 


GLN 


Q 


3 


0.93 


384.18 


1.12 


14 


ASN 


N 


6 


1.86 


684.24 


2.00 


15 


LYS 


K 


9 


2.79 


1152.81 


3.37 


16 


ASP 


D 


18 


5.57 


2070.54 


6.06 


17 


GLU 


E 


11 


3.41 


1419.44 


4.15 


18 


CYS 


C 


2 


0.62 


206.02 


0.60 


19 


TRP 


W 


6 


1.86 


1116.48 


3.27 


20 


ARG 


R 


20 


6.19 


3122.00 


9.14 


21 


GLY 


G 


33 


10.22 


1881.66 


5.51 


22 




- 


0 


,0.00 


0.00 


0.00 



PESIDUS ^ 323 

POIDS MOLECUIAIBE «= 34175. 

INDEX DE POIARITE (%) = 31. 

POINT ISOELECTRIQOE = 8.00 

DO 260 (Img/ml) » 0.789 DO 280 (Img/ml) = 1.150 



FROrn. D'BYDBOPHILICITE DE lA FB0IEIME 
COBO DE in 323 ' 




FIGURE 15.8 
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GENE cobE ET PROTEINE COBE 

SEQUENCE DU FRAGMENT Clal-HlndllT -Htndl ll .Hlndl ll DE 5396 BP, DE 549 A 1010 

MetProSerGlyGlnHisSerAlaGlnThrThrLy^aGlyAlaGlyLeuValLeuGlyLeuGlyCysGluAro 

atgccatcgggccaacactctgcacagacgacgaAagcaggagccgggctggtgctcgggctcggctgcgagcgt 

549 559 569 579 589 599 609 



cgcacgccggccgaagaggtgatcgcccttgccgagcgtgcgcttgccgatgccggtgttgcgcccggcgatctg 

624 634 644 654 664 674 684 

ArgLeuValAlaSerLeuAspAlaArgAlaGluGlviProAlalleLe\AlaAlaAlaGlnHisPheAlaValPro 

699 709 719 729 , 739 749 759’. 

AlaAlaPheTyrAspAlaAlaThrLeuGluAlaGluAlaSerArgLeuAlaAsnProSerGluileValPheAla 

gccgcgttctacgatgccgccacgctcgaagccgaagcttcccggctcgccaacccgtccgagatcgtctttgcc 

774 784 794 804 '’814 824 834 

TyrThrGlyCysHisGlyValAlaGluGlyAlaAlaLeuValGlyAlaGlyArgGluAlaValLeuIleValGln 

tacacgggttgtcatggcgttgccgagggtgcagcgctcgtcggcgccggtcgcgaagccgtgctgattgtgcag 

849 859 869 879 889 899 909 

s ^ l®Val SarAl aH^ sAl aThrAl aAl aLauAl aGly P r oAl aThrLauAroAl aGluLv sAxqX laGlnAl a 

AAGATCGTCTCCGCCCATGCGACGGCCGCACTTGCCGGGCCGGCGACCTT6CGCGCCGAAAAGCGCATCCAGGCG 

924 934 944 954 ' : 964 974 984 

AlaGluAlaVal*** 

GC6GAGGCTGTCTGA 

999 1009 1013 1029 1039 1049 1059 



944 


954 


964 


1019 


1029 


1039 



figure 15.9 
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Jc3/4<r4 

NOM * COBE PREMIER RESIDU = 1 

DERNIER RESIDU = 154 









NCMBRE 


% NOMB 


POIDS 


% POIDS 


1 


PHE 


F 


3 


1.95 


441.21 


2.85 


2 


LEU 


L 


15 


9.74 


1696.20 


10.96 


3 


ILE 


I 


6 


3.90 


678. 4B 


4.38 


4 


MET 


M 


1 


0.65 


131.04 


0.85 


5 


VMi 


V 


12 


7.79 


1188.84 


7.68 


6 


‘ SER 


S 


6 


3.90 


522.18 


3.37 


7 


PRO 


P 


7 


4.55 


679.35 


4.39 


8 


THR 


T 


7 


4.55 


707.35 


4.57 


9 


ALA 


A 


41 


26.62 


2912.64 


18.82 


10 


TYR 


Y 


2 


1.30 


326.12 


2.11 


11 


★ 


★ 


0 


0.00 


6.00 


0.00 


12 


HIS 


H 


4 


2.60 


548.24 


3.54 


13 


GLN 


Q 


5 


3.25 


640.30 


4.14 


14 


ASN 


N 


1 


0.65 


114.04 


0.74 


15 


LYS 


K 


3 


1.95 


384.27 


2.48 


16 


ASP 


D 


4 


2.60 


460.12 


2.97 


17 


GLU 


E 


13 


8.44 


1677.52 


10.84 


18 


CYS 


C 


2 


1.30 


206.02 


1.33 


19 


TRP 


W 


0 


0.00 


0.00 


0.00 


20 


ARG 


R 


9 


5.84 


1404.90 


9.08 


21 


GLY 


G 


13 


8.44 


741.26 


4.79 


22 






0 


0.00 


0.00 


0.00 




RESIDUS 




-= 154 








POIDS 


MOLECULAIRE 


= 15478. 








INDEX 


DE 


POLARITE (%) 


« 34. 








POINT ISOELECTRIQUE 


= 5.61 







DO 260 (Img/ml) = 0.113 DO 280 (Img/ml) = 0.154 



PROnL D'BXDRQPHZLICITE DE lA PBOTEINE 
COBE DE 1 fl 154 
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GENE cobF ET PROTEINE COBF 

SEQUENCE DO FRAGMENT DE 8753 BP,- DE 73^ A 1521 

MetAlaGluAlaGlyMetArgLyslleLeullell^GlyileGiySerGlyAsnProGluHisMetThrValGln 
ATGGCGGAGGCGGGCATGCGCAAAATTCTGATCATCGGCATCGGTTCGGGCAATCCCGAACACATGACCGTGCAG 
736 746 756 766 776 786 796 

AlaIleAsnAlaLeuAsnCysAlaAspValLeuPheIleProThrLysGlyAlaLysLysThrGlvtLe\aAlaGlu 
GCGATCAACGCGCTGAACTGCGCCGACGTGCTCTTTAlCCCGACCAAGGGAGCGAAGAAGACCGAGCTTGCCGAA 
811 821 831 841 ,851 , 861 871 

ValArgArgAsplleCysAlaArgTyrValThrArgLysAspSerArgThrValGluPheAlaValProValArg 
GTGCGCCGCGACATCTGCGCCCGCTACGTCAGGCGCAA^GACAGCCGCACCGTCGAGTTCGCGGTGCCCGTGCGG 
886 896 906 916 926 936 946 

ArgThrGluGlyValSerTyrAspGlySeryalAspAspTrpHisAlaGlnlleAlaGlylleTyrGlviAlaLeu 
CGCACCGAAGGCGTCAGCTATGACGGCAGCGTC6AT6ACTGGCACGCCCAGATCGCTGGGATTTACGAAGCGCTT 
961 971 981 991 1001 1011 1021 

LeuSerLysGluLeuGlyGluGluGlyThrGlyMaPheLeuValTrpGlyAspProMetLeuTyrAspSerThr 
CTATCGAAGGAGTTGGGCGAAGAGGGAACTGGCGCGTTTCTCGTCTGGGGCGACCCGATGCTCTATGACAGCACC 
1036 1046 1056 1066 :1076 lt)86 1096 

IleArglleValGluArgValLysAlaArgGlyGliiValAlaPheAlalVrAspVaineProGlylleThrSer 
ATTCGCATCGTCGAGCGGGTCAAGGCACGCGGTGAGGTCGCCTTCGCCTACGACGTCATTCCCGGGATCACCAGT 
nil 1121 1131 1141 :;1151 1161 1171 

LeuGlnAlaLeuCysAlaSerHisAr^leProLeuAsnLeuValGlyLysProValGluIleThrThrGlyArg 
CTGCAGGCGCTTTGCGCCAGCCACCGCATTCCGCTGAACCtCGTCGGCAAGCCGGTGGAGATCACCACGGGGCGT 
1186 1196 1206 1216 v 1226 1236 1246 

ArgLeuHisGluSerPheProGliiLysSerGlnThrSerValValMetLeuAspGlyGluGlnAlaPheGlnArg 

cggctgcacgaaagctttcccgagaagagccagacctcggtcgtcatgCtcgatggcgaacaggcgtttcagcgg 

1261 1271 1281 1291 1301 1311 1321 

ValGluAspProGluAlaGluIleTyrTrpGlyAiaiiVrLeuGlyThrArgAspGlTjIleVallleSerGlyArg 

gtcgaggacccggaggcggagatctattggggcgcCtatctcggcacgcgggatgagatcgtcatttccggccgc 

1336 1346 1356 136^' - 1376 1386 1396 

ValAlaGluValLysAspArglleLeuGlufhrArc^^aAlaArgAlaLysMetGlyTrpIleMetAspIle 

gtggctgaggtgaaggaccggatccttga^cgcgggcggcggcgcgcgcgaagatgggatggatcatggacatc 

1411 1421 1431 1441 -’1451 ::1461 1471 

TyrLeuLeuArgLysGlyAlaAspPheAspGlu*** 

TATCTCCTGCGCAAGGGCGCCGACTTCGACGAGTGA 
1486 1496 1506 1516 



FIGURE 16.1 
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PROTEINE COBF PREMIER RESIDU = 1 

DERNIER RESIDU = 261 









NOIBRE 


% NOIB 


POIDS 


% POIDS 


1 


PHE 


F 


7 


2.68 


1029.49 


3.56 


2 


LEU 


L 


19 


7.28 


2148.52 


7.43 


3 


ILE 


I 


21 


8.05 


2374.68 , 


8.21 


4 


MET 


M 


7 


2.68 


917.28 


3.17 


5 


VAL 


V 


22 


8.43 


2179.54 


7.53 


6 


SEK 


s 


12 


4.60 


1044.36 


3.61 


7 


PRO 


p 


9 


3.45 


873.45 


3.02 


8 


THR 


T 


14 


5.36 


1414.70 


4.89 


9 


ALA 


A 


27- 


10.34 


1918.08 


6.63 


10 


TYR 


Y 


8 


3.07 


1304.48 


4.51 


11 


★ 


★ 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


4 


1.53 


548.24 


1.90 


13 


GLN 


Q 


6 


2.30 


768.36 


2.66 


14 


ASN 


N 


4 


1.53 


456.16 


1.58 


15 


LYS 


K 


12 


4.60 


1537.08 


5.31 


16 


ASP 


D 


16 


6.13 


1840.48 


6.36 


17 


GLU 


E 


23 


8.81 


2967.92 


10.26 


18 


CYS 


C 


3 


1.15 


309.03 


1.07 


19 


TRP 


w 


4 


1.53 


744.32 


2.57 


20 


ARG 


R 


21 


8.05 . 


3278.10 


11.33 


21 


GLY 


G 


22 


8.43 


1254.44 


4.34 



RESIDUE = 261 

POIDS MOLECULAIRE = 28927. 

INDEX DE POLARITE (%) = 43. 

POINT ISOELECTRIQUE = 5.70 

DO 260 (Img/ml) = 0.705 DO 280 (Img/ml) = 1.097 
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GENE cobG ET PROTEINE COBG 

SEQOENCE DU FRAGMENT DE 8753 BP, DE 1620 A 2999 

MetThrAspLeuMetThrSerCysAlaLe\jProl«uThrGlyAspAlaGlyThrValAlaSerMetAraAraGlv 

atgacggatttgatgaccagctgcgcccttccattgaccggagatgccggcaccgtcgcttcgatgcg^ggc 

1620 1630 1640 1650 1660 1670 1680 

AlaC^sProSerLeuAlaGluProMetGlnThrGlyAspGlyLeviLeuValArgValArgProThrAspAsDSer 

GCCTGCCCGTCCTTGGCAGAGCCGATGCAGACCGGCGACGGCCTGCTCGTGAGGGTGAGGCCAACGGATGACAGC 

1695 1705 1715 1725 1735 ;r ' 1745 1755 

LeuThrLeuProLysVallleAlaLeuAlaThrAlaAlaGluT^gPheGlyAsnGlyllelleGluIleThrAla 

CTGACGCTGCCGAAGGTCATTGCCCTTGCCACGGCTGCCGAGCGCTTCGGCAATGGCATCATCGAGATTACCGCG 

1770 1780 1790 1800 1810 1820 1830 

ArgGlyAsnLeuGlnLeiiArgGlyLeuSerAlaAlaSerValProArgLeuAlaGlnAlalleGlyAspAlaGlu 

CGCGGAAACCTGCAGCTTCGCGGCCTGAGCGCGGCTTCGGTGCCAAGGCTGGCGCAGGCGATCGGCGATGCGGAG 

1845 1855 1865 1875 1885 1895 1905 

IleAlalleAlaGluGlyLeuAlalleGluValProProLeuAlaGlylleAspProAspGluIleAlaAspPro 

ATCGCCATTGCCGAGGGGCTCGCGATCGAGGTGCCGCCCCTGGCCGGCATCGACCCGGACGAGATCGCCGATCCG 

1920 1930 1940 1950 1960 1970 1980 

ArgProlleAlaThrGlviLeuArgGluAlaLev>AspValArgGlnValProLeuLysLe\jAlaProLvsLeuSer 

cggccgattgccactgagcttcgtgaagcgttggatgtgcgccaggtGccgttgaagcttgcacccaaattatcc 

1995 2005 2015 2025 2035 2045 2055 

y^iY4^^®^P^®^®^y°^y^5^^®‘^^y^"‘^^y^aValValAlaAspIleArgLeuGlnAlaValSerThr 

2070 2080 2090 2100 2110 2120 2130 

2145 2155 2165 2175 2185 2195 2205 

AsnMaValValProAlaLeuIleThrlleLeuGluLysLeuAlaSerLeuGlyThrThrMetArgGlvAroAsD 

2220 2230 2240 2250 '2260 2270 2280 

^:®!i^?P^5°!“®^"^^®^9^2^"CysArgCysGluThrSerSerGluArgProAlaAlaProArgSerAla 

CTGGACCCGTCGGAAATCCGCGCGCTCTGTCGCTGTGAGACATCGTCCGAACGCCCGGCCGCTCCGCGTTCGGCC 

2295 2305 2315 2325 2335 2'S45 2355 

^alleProGlylleHisAlaLeuGlyAsnAlaAspThrValLeuGlyLeuGlyLeuAlaPheAlaGlnValGlu 
„ , _®^^^^^^®’*^^^*^TGCGCTGGGTAACGCCGACACCGTTCTCGGCCTCGGTCTGGCCTTTGCTCAGGTGGAG 

2370 2380 2390 2400 2410 2420 2430 

^^i®^®^®'^®®®^^^®"^®®^"V^G^aLe“GlyAlaAsnAlaIleArgLeuAlaProGlvHis 

gccgccgcgctggcatcctacctgcatcaggtccaGgcgcttggcgccaatgcgatccggcttgcgcccgggcac 

2445 2455 2465 2475 2485 2495 2505 

^CTTCTTCGTCCTCGGCCTTTGCCCCGAGACCGCSGCTGTGGCGCAGAGCCTGGCAGCGTCACACGGTTTTCGC 

2520 2530 2540 2550 2560 2570 2580 

2595 2605 2615 2625 2635 2645 2655 

ThrLysGlyMetAlaGluArgLeuValGluThrAlaProGlt3Lev0.euAspGlySerLeuThrValHisLeuSer 

accaagggcatggccgagcgcctcgtcgagacggcgccggaattgctcgacgggtcgctcaccgtgcatctctcc 

2670 2680 2690 2700 2710 2720 2730 

GlyCy sAlaLysGlyCysAlaArgProLysProSerGltiLeuThrLeuValGlyAl aProSerGlvTvrGl vLeu 
^CTGCGCCAAGGGCTGCGCCX:GGCCGAAGeCGTCCGAACTGACGCTTGTCGGTGCGCCATCAGGATACGGGCTT 

2745 2755 2765 2775 ,2785 2795 2805 

YfliY®^”'’^^^®^®^®"^^y^®'^^®®®^®^^^AspGluAsnGlyMetGlySerAlaLeuAlaArCT 
a of ^^*^^^^^^®^^®*^^®^^^^®'^^®'^^^*^®'^^^^C^^^7’GAGAATGGAATGGGATCCGCCCTTGCCCGG 
2820 2830 2840 2850 - 2860 2870 2880 

LeuGlyArgLeuValArgGlnAsnLysAspAlaGlyGluSerAlaGlnSerCysLeuThrArqLeuGlvAlaAla 
a of ^^®^^^®’^^^^^®^^^^^^*-^^®^CGCTGGeGAATCGGCGCAGTCCTGTCTTACACGGCTCGGAGCTGCG 
2895 2905 2915 2925 .2935 2945 2955 

ArgValSerAlaAlaPheGluGlnGly*** 

CGCGTCTCGGCAGCGTTCGAACAGGGATAG 
2970 2980 2990 3000 



FIGURE 16.3 
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PCT/FR91/000S4 






PROTEINB COBG 


PREMIER RESIDU 


» 1 










DERNIER RESIDU 


- 459 








NOMBFE 


% NOMB 


POIDS % 


POIDS 


1 


PHE 


F 


7 


1.53 


1029.49 


2.21 


2 


LEU 


L 


56 


12.20 


6332.48 


13.57 


3 


ILE 


I 


21 


4.58 


2374 . 68 


5.09 


4 


MET 


M 


8 


1.74 


1048.32 


2.25 


5 


VAL 


V 


31 


6.75 


3071.17 


6.58 


€ 


.SER 


S 


32 


6.97 


2784.96 


5.97 


7 


PRO 


P 


26 


5.66 


2523.30 


5.41 


8 


THR 


T 


27 


5.88 


2728.35 


5.85 


9 


ALA 


A 


78 


16.99 


5541.12 


11.88 


10 


TYR 


Y 


3 


0.65 


489.18 


1.05 


11 


* 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


5 


1.09 


685.30 


1.47 


13 


GLN 


Q 


13 


2.83 


1664.78 


3.57 


14 


ASN 


N 


10 


2.18 


1140.40 


2.44 


15 


LYS 


K 


10 


2.18 


1280.90 


2.75 


16 


ASP 


D 


19 


4.14 


2185.57 


4.68 


17 


GLU 


£ 


24 


5.23 


3096.96 


6.64 


18 


CYS 


C 


10 


2.18 


1030.10 


2.21 


19 


TRP 


W 


2 


o:44 


372.16 


0.80 


20 


ARG 


R 


29 


6.32 


4526.90 


9.70 


21 


GLY 


G 


48 


10.46 


2736.96 


5.87 


22 


• 


"■ 


0 


0.00 


0.00 


0.00 




RESIDUE 




= 459 








POIDS MOLECULAIRE 


*= 46661. 








INDEX : 


DE POLARITE (%) 


= 37. 








POINT ISOELECTRIQUE 


= 6.41 








DO 260 


(Img/ml) 


= 0. 


215 DO 280 


(Img/ml) = 


0.315 



COBO DE 1 A 4S9 




FIGURE 16.4 
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GENE cobH ET PBOTEINE COBH 

SEQUENCE DU FRAGMENT DE 8753 BP, DE 3002 A 3634 



MetProGluTyrAspTyrlleArgAspGlyAsnAlaJleTyrGluArgSferPheAlallelleAroAlaGluAla 
ATGCCTGAGTATGATTACATTCGCGATGGCAACGCCATCTACGAGGGTTCCTTCGCCATCATCCGCGCCGAGGCC 
3002 3012 3022 3032 3042 3052 3062 

AspLeuSerArgPheSerGluGluGluAlaAspLeuAlaValArgMetValHisAlaCysGlySerValGl\iAla 

gatctgtcgcgcttctccgaagaggaagcggatctggctgtgcGcatggtgcacgcctgcggttccgtcgaggcg 

3077 3087 3097 3107 3117 3127 3137 

ThrArgGlnPheValPheSerProAspPheValSerSerAlaArgAlaAlaLeuiysAlaGlyAlaProIleLeu 

accaggcagttcgtgttttctcccgatttcgtaagctcggcccgtgcggcgctgaaagccggtgcgccgatcctc 

3152 3162 3172 3182 3192 3202 3212 

CysAspAlaGluMetValAlaHisGlyValThrArgAlaArgLeuProAlaGlyAsnGluVallleCvsThrLeu 

3227 3237 3247 3257 3267 3277 3287 

ArgAspProArgThrProAlaLeuAlaAlaGluIleGlyAsnThrArgSerAlaAlaAlaLeuLysLeuTrpSer 

cgcgatcctcgcacgcccgcacttgcggccgagaTcggcaacacccgctccgccgcagccctgaagctctggagc 

3302 3312 3322 3332 3342 3352 3362 

GluArgLeiiAlaGlySerValValAlalleGlyAsnMaProThrAlaLeuPhePheLeuLeuGltaMetLeuAra 

,__?^*^^®®^^®®^^^^'^®®'^®*'^^^^®^^^®scaaG^cgccgacggcgttgttcttcctcttggaaatgctgcgc 

3377 3387 3397 3407 3417 3427 3437 

AspGlyAlaProLysProAlaAlalleLeuGlj44^ProValGlyPheValGlyAlaAiaGluSerLysAspAla 

^cggcgcgccgaagccggcggcaatcctcggcatgcccgtcggtttcgtcggtgcggcggaatcgaaggatgcg 

3452 3462 3472 3482 3492 3502 3512 

LeuAlaGluAsnSerTyrGlyValProPheAlalleValArgGlyArgLeuGlyGlySerAlaMetThrAlaAla 

3527 3537 3547 3557 3567 3577 

AlaLeuAsnSerLeuAlaArgProGlyLeu*** 

GCGCTTAACTCGCTCGCGAGGCCGGGCCTGTGA 
3602 3612 3622 3632 



3587 



FIGURE 16.5 
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PROTEINE 


COBH 


PREMIER RESIDU 


= 1 










DERNIER RESIDU 


= 210 










NOMBRE 


% NOME 


POIDS 


% POIDS 


1 


PHE 


F 


9 


4.29 


1323.63 


6.00 


2 


LEU 


L 


20 


9.52 


2261.60 


10.26 


3 


ILE 


I 


10 


4.76 


1130.80 


5.13 


4 


MET 


M 


6 


2.86 ' 


786.24 


3.57 


5 


VAL 


V 


14 


6.67 


1386.98 


6.29 


6 


. SER 


S 


14 


6.67 


1218.42 


5.53 


7 


PRO 


P 


12 


5.71 


1164.60 


5.28 


8 


THR 


T 


7 


3.33 


707.35 


3.21 


9 


ALA 


A 


40 


19.05 


2841.60 


12.89 


10 


TYR 


Y 


4 


1.90 


652.24 


2.96 


11 


* 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


2 


0.95 


274.12 


1.24 


13 


GLN 


Q 


1 


0.48 


128.06 


0.58 


14 


ASN 


N 


6 


2.86 


684.24 


3.10 


15 


LYS 


K 


4 


i.sio 


512.36 


2.32 


16 


ASP 


D 


9 


4.29 


1035.27 


4.70 


17 


GLU 


E 


14 


6.67 


1806.56 


8.19 


18 


CYS 


C 


3 


1.43 


309.03 


1.40 


19 


TRP 


w 


1 


0.48 


186.08 


0.84 


20 


ARG 


R 


17 


8.10 


2653.70 


12.03 


21 


GLY 


G 


17 


8.10 


969.34 


4.40 


22 


- 


- 


0 


0.00 


0.00 


0.00 



PESIDUS 

POIDS MOLECULAIHE 
INDEX DE POLARITE (%) « 
POINT ISOELECTRIfflJE » 
DO 260 (Img/ml) = 0.291 



210 

22050. 

35. 

6.22 

DO 280 (Img/ml) = 0.467 



COBH DE 1 A 21B 




FIGURE 16.6 
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GENE cobi ET PROTEINE GOBI 

SEQUENCE DU FRA(31ENT DE 8753 BP, DE 3631 A 4368 

MetSerGlyValGlyValGlyArgLeuIleGlyValGlyThrGlyProGlyAspProGluLeuLeuThrValLys 
GTGAGCGGCGTCGGCGTGGGGCGCCTGATCGGTGTfifeGGACCGGCCCCGGTGATCCGGAACTTTTGACGGTCAAG 
3631 3641 3651. 3661 >>3671 3681 3691 

AlaValLysAlaLeuGlyGlnAlaAspValLeuAla^rPheAlaLysAlaGlyArgSerGlyAsnGlyArgAla 
GCGGTGAAGGCGCTCGGGCAAGCCGATGTGCTTGCtTATTTCGCCAAGGCCGGGCGAAGCGGTAACGGCCGCGCG 
3706 3716 3726 3736 3746 3756 3766 

ValValGluGlyLeuLeuLysProAspLeuValGlULLeuProLeuTyriyrProValThrThrGltalleAspLys 
GTGGTCGAGGGTCTGCTGAAGCCCGATCTTGTCSi^TGCCGCTATACTATCCGGTGACGACCGAAATCGACAAG 
3781 3791 3801 3811 ^821 3831 3841 

AspAspGlyAlaTyrLysThxGlnIleThrAspPhe*^rAsnAlaSerAlaGluAlaValAlaAlaHisLeuAla 
GACGATGGCGCCTACAAGACCCAGATCACCGACTTC5 A«lATGCGTCGGCCGAAGCGGTAGCGGCGCATCTTGCC 
3856 3866 3876 3886 3896 3906 3916 

AlaGlyArgThrValAlaValLeuSerGluGlyAspproLeuPheTyrGlySerTyrMetHi sLeuHi sValArg 

gccgggcgcacggtcgccgtgctcagtgaaggcgacccgctgttctatggttcctacatgcatctgcatgtgcgg 

3931 3941 3951 3961 . ;3971 3981 3991 

LeuAlaAsnArgPheProValGluVallleProGiyrieThrAlaMetSerGlyCysTrpSerLeuAlaGlyLeu 

ctcgccaatcgtttcccggtcgaggtgatccccggcattaccgqiatgtccggctgttggtcgcttgccggcctg 

4006 4016 4026 4036 4046 4Q56 4066 

ProLeuV al GlnGlyAspAspValLauSerValLejiiPiroGlyThrMa'ti^ aGXuAl aGlULLeuGlyArgArgLeu 
CCGCrGGrGCAGGGCGACGACGTGCTCTCGGTGCfrdCGGGCAGCATGGCCGAGGCCGAGCTCGGCCGCAGGCTT 
4081 4091 4101 4111, ‘ 4121 4i31 4141 

AlaAspThrGlTiAlaAlaValIleMetLysValGlyArgAsnL6uProLysIleArgArgAlaLeuAlaAlaSer 

gcggataccgaagccgccgtgatcatgaaggtcgGGCgcaatttgccgAagatccgtcgggcgctcgctgcctcc 

4156 4166 4176 4186 4196 4206 4216 

GlyArgLeuAspGlnAlaValTyrValGlxiArgGlyThrMetLysAsnAlaAlaMetThrAlaLeuAlaGluLys 
GGCCGTCTCGACCAGGCCGTGTATGTCGAACGCGGC^eGATGAAGAACGCGGCGATGAGGGCTCTTGCGGAAAAG 
4231 4241 4251 4261 4271 4281 4291 

AlaAspAspGluAlaProTyrPheSerLeuValLeuValProGlyTrpLysAspArgPro*** 
GCCGACGACGAGGCGCCCTATTTCTCGCTGGTGCTCGTTCCCGSCTGGAAGGACCGACCATGA 
4306 4316 4326 4336 .4346 4356 4366 



FIGURE 16.7 
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PROTEINE GOBI PREMIER EMIDU ■ 1 

DERNIER RESIDU » 245 



NOMBRE 



1 PHE F 5 

2 LEU L 28 

3 ILE I 7 

4 MET M 7 

5 VM. V 25 

6 SER S 10 

7 PRO P 14 

8 THR T 12 

9 ALR A 34 

10 TYR Y 9 

11 * * 0 

12 HIS H 3 

13 GLN Q 4 

14 ASN N . 5 

15 LYS K 11 

16 ASP D 15 

17 GLU E 13 

18 CYS C 1 

19 TRP w 2 

20 ARG R 14 

21 GLY G 26 

22 - - 0 



RESIDUS 

POIDS MOLECULAIRE 
INDEX DE POLARITB (%) 
POINT ISOELECTRIQOE 
DO 260 (Img/ml) = 0. 



% NOMB ; 


POIDS 


% POIDS 


2.04 


73S.35 


2.84 


11.43 


3166.24 


12.24 


2.86^ 


791.56 


3.06 


2.86 


917.28 


3.54 


10.20 


2476.75 


9.57 


4.08 


870.30 


3.36 


5.71- 


1358.70 


5.25 


4.99 


1212.60 


4.69 


13.818 


2415.36 


9.33 


3.67 


1467.54 


5.67 


0.00 


. 0.00 


0.00 


1.22 


411.18 


1.59 


1.63 


512.24 


1.98 


2.04 


570.20 


2.20 


4.49 


1408.99 


5.44 


6.12 


1725.45 


6.67 


5.31 


1677.52 


6.48 


0.41. 


103.01 


0.40 


0.82 


372.16 


1.44 


5.71 


2185.40 


8.44 


10.61i- 


1482.52 


5.73 


0.00 


0.00 


0.00 


= 245 






* 25878. 






= 36. 






= 6.17 







D^ 280 (Img/ml) = 0.843 




• 2 . 



12i 144 168 182 216 240 

figure 16.8 , 



24 



48 



72 06 
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GENE cobJ ET PROTEINE COBJ 

SEQUENCE DU FRAQIENT DE 8753 BP, DE 4365 A 5129 

MetThrGlyThrLeuTyrValvalGlyThrGlyProGlySerAlaLysGlnMetThrProGluThrAlaGluAla 

ATGACCGGTACGCTCTATGTCGTCGGTACCGGACCGGGCAGCGCCAAGCAGATGACGCCGGAAACGGCGGAAGCC 

4365 4375 4385 4395 4405 4415 4425 

Y?i^^^^®^!J°^'^^®^^SlyTyrPheproTyrl.euAspArgLeiAsnLeuArgProAspGlnIleArg 

gttgcggccgctcaggagttttacggctactttccctatctcgaccggctgaacctcagaccggatcagatccgt 

4440 4450 4460 4470 4480 4490 4500 

ValAl aSerAspAsnAr gGluGluLeuAspArgAlaGl nValAl aLeuThr ArqAl aAl aAl aGl vValLv sVal 

gtcgcctcggacaaccgcgaggagctcgatcgggcacaggtcgcgctgacgcgggctgcggcaggcgtgaaggtc 

4515 4525 4535 4545 4555 4565 4575 

CysMetValSerGlyGlyAspProGlyValPheAlalietAlaAlaAlaValCysGluAlalleAspLvsGlvPro 

4590 4600 4610 4620 4630 4640 4650 

AlaGluTrpLysSerValGluLeuVallleThrProGlyValThrAlatfetLeuAlaValAlaAlaAralleGlv 

GCGGAATG^GTCGGTTGAACTGGTGATCACGCCCGGCGTGACCGCGATGCTCGCCGTTGCCGCCCG^CGGC 

4665 4675 4685 4695 4705 . 4715 4725 

4740 4750 4760 4770 . 4780 4790 4800 

J;™Y^5^:®'^^^‘^^^^^^yP^®^®l^l®AlaLeuTyrAsnProIleSerLysAlaArgProTrpGlnLeu 
ii 01 c^^^‘^^T^^^^®^®^^®^^^^'^^^‘^^^’’^^^^^^CC6ATCAGCAAGGCGCGGCCCTGGCAGCTC 
4815 4825 4835 4845 4855 4865 4875 

oiYSi’Y^®^*'®'^^'^^®'^5^®^^®^^'^^^^SerValProValIlePheGlyArgAlaAlaGlvAra 

4890 4900 4910 4920 4>30 4940 4950 

?f2^f?*^^'^^^^®^®'^®^®^^^°^®'^®^y®^'^®AspAlaAshArgAlaAspMetAlaThrCysValIle 

^^®^^®^CGGATCGCGGTGATGCCGCTCGGCGAGSCC(^TGCCAACCGCGCCGACATGGCGACCT6CGTCATC 

4965 , 4975 4985 4995 5005 5015 5025 

Jio^iY®«f^Y°®^Y^^^5^^®'^®^®^^9AspGlyGlnProAspLeuValTyrThrProArgPheTyrAla 

5040 5050 5060 5070 5080 5090 

GlyAlaSerGln*** 

GGGGCGAGCCAGTGA 
5115 5125 



5100 



figure 16.9 
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PROTEINE COBJ PREMIBR RESIBU » 1 

DERMI^' RESIDU « 254 









NOMBRE 


% NOMB 


POIDS % 


POIDS 


1 


PHE 


F 


8 


3.15 


1176.56 


4.34 


2 


LEU 


L 


20 


7.87 


2261.60 


8.35 


3 


ILE 


I 


13 


5.12 


1470.04 


5.43 


4 


MET 


M 


7 


2.76 


917.28 


3.39 


5 


VAL 


V 


23 


9.06 


2278.61 


8.41 


6 


SER 


S 


11 


4.33 


957.33 


3.53 


7 


PRO 


P 


18 


7.09 


1746.90 


6.45 


8 


THR 


T 


12 


4.72 


1212.60 


4.48 


9 


ALA 


A 


40 


15.75 


2841.60 


10.49 


10 


TYR 


Y 


7 


2.76 


1141.42 


4.21 


11 


* 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


1 


0.39 


137.06 


0.51 


13 


GLN 


Q 


7 


2.76 


896.42 


3.31 


14 


ASN 


N 


5 


1.97 


570.20 


2.11 


15 


LYS 


K 


6 


2.36 


768.54 


2.84 


16 


ASP 


D 


13 


5.12 


1495.39 


5.52 


17 


GLU 


£ 


16 


6.30 


2064.64 


7.62 


18 


CYS 


C 


4 


1.57 


412.04 


1.52 


19 


TRP 


W 


3 


1.18 


558.24 


2.06 


20 


ARG 


R 


19 


7.48 


2965.90 


10.95 


21 


GLY 


G 


21 


8.27 


1197.42 


4.42 


22 


• 


• 


0 


0.00 


0.00 


0.00 




RESIDUS 




» 254 








POIDS 


MOLECUIAIRE 


= 27088. 








INDEX 


D£ 


POLARITE (%) 


= 35. 








POINT ISOELECTRIQUE 


“ 5.43 








DO 260 


1 (Img/rol) » 0. 


575 DO 280 


1 

1 

n 


0.922 




2S 



75 




wo 91/11518 



PCT/FR91/00054 



GENE CObK ET PROTEINE COBK ' b® 

SEQUENCE DU FRACaJENT ECORI-ECOKE DE 8753 PB DE 2861 A 3646 SUR LE BRIN 
CXaiPLEMENTAIBE 



MAGSLFDTSAM EKP R ILILGGTTEA 
ATGGCGGGTTCGCTGTTCGACACGTCAGCCATGGAAAAACCTCGIATTCTGATTCTGGGTGGCACCACCGAGGCA 
2861 2871 2881 2891 1 2901 2911 2921 2931 

RELARRLAE D V; RY D T A I S LA G RTAD 

CGCGAACTCGCGCGCCGCTTGGCCGAAGATGTCCGCTACGACACCGCCATCTCGCTGGCCGGCCGCACCGCGGAC 
2936 2946 2956 2966 2976 2986 2996 3006 

PRPQPVKTR IG'GFGGADGLAHFVHD 
CCGCGGCCGCAGCCGGTCAAGACGCGCATGGGCGGCTTTGGCGGCGCCGATGGGCTGGCGCATTTCGTGCATGAC 
3011 3021 3031 3041: 3051 ? 3061 3071 3081 

ENIALLVDA TH PFAA RI SHNAADAA 
GAAAACATCGCGCTGCTGGTCGATGCGACGCAGCCCTTTGCCGCACGCATTTCGCACAACGCCGCGGACGCAGCG 
3086 3096 3106 i ,3116 3126 : : .3136 3146 3156 

QRTGVAL lA.LRRP E WVP L P GD RWTA 

CAAAGAACCGGCGTTGCGCTTATCGCCCrCCGCCGACCGGAATGGGTGCCCCTGCCTGGCGACCGCTGGACTGCT 
3161 3171 3181 3191 ' 3201 3211 3221 3231 

VDSVVEAV SAL GD R R RRVFLAIGR Q 
GTCGATAGCGTTGTCGAGGCCGTCAGCGCGCTCGGTGATCGGCGACGCCGCGTCTTCCTGGCGATAGGTCGACAG 
3236 3246 3256 3266 3276 3286 3296 3306 

E A F H F E V A P Q H S YV I R S V D P V T P P L 

GAAGCTTTCCACTTCGAGGTCGCGCCGCAGCAdAGCTACGTCATCCGCAGCGTCGATCCGGTGACGCCGCCGCTT 
3311 3321 3331 , 3341 ' 3351 3361 3371 3381 

NLPDQEAILA T G PFA EADEAALLRS 
AATCTGCCCGACCAGGAGGCGATCCTGGCGACCGGTCCCTTTGCGGAAGCCGACGAAGCCGCGXTGCTCAGGAGT 
3386 3396 3406 3416 ‘ 3426' 3436 3446 3456 

RQIDVIVAKN 9. GG SATYGKIAAARR 

cggcagatcgatgtgatcgtcgccaagaacaGcggtggcagcgccacctacggcaagattgccgcagcgcgccgg 

3461 3471 3481 3491 3501 3511 3521 3531 

L G I E V I M V E R R K P A D VP T VGSCDEA 

ctcggcatcgaggtgatcatggtcqvgcggcgcaagcccgcgGacgtgccgacggtcggcagttgcgacgaggca 

3536 3546 3556 3566 3576 3586 3596 3606 

LNRIAHWLAP A 
CTCAACCGCATCGCTCACTGGCTCGCCCCTGCATGA 
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NCM = COBK PREMIER RESIDU = 1 

DERNIER RESIDU = 261 









NOMBRE 


% N<»ffi 


POIDS 


% POIDS 


1 . 


PHE 


F 


8 


3.07 


1176.55 


4.19 


2 


LEU 


L 


22 


8.43 


2487.85. 


8.86 


3 


ILE 


I 


16 


6.13 


1809.34 


6.44 


4 


MET 


M 


3 


1.15 


393.12 


1.40 


5 


VAL 


V 


21 


8.05 


2080.44 


7.41 


6 


SER 


S 


12 


4.60 


1044.38 


3.72 


7 


PRO 


P 


17 


6.51 


1649.90 


5.88 


8 


THR 


T 


13 


4.98 


1313.62 


4.68 


9 


ALA 


A 


42 


16.09 


2983.56 


10.63 


10 


TYR 


Y 


3 


1.15 


489.19 


1.74 


11 


★ 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


7 


2.68 


959.41 


3.42 


13 


GLN 


Q 


6 


2.30 


768.35 


2.74 


14 


ASN 


N 


5 


1.92 


570.21 


2.03 


15 


LYS 


K 


5 


1.92 


640.47 


2.28 


16 


ASP 


D 


17 


6.51 


1955.46 


6.96 


17 


GLU 


E 


15 


5.75 


1935.64 


6.89 


18 


CYS 


C 


1 


0.38 


103.01 


0.37 


19 


TRP 


W 


3 


1.15 


558.24 


1.99 


20 


ARC 


R 


26 


9.96 


4058.63 


14.45 


21 


GLY 


G 


19 


7.28 


1083.41 


3.86 


22 


- 




0 


0.00 


0.00 


0.00 



RESIDUS = 261 

Masse moleculalre (monolsotopic[ue) = 28078.7988 

Masse moleculalre (moyenne) » 28096.0195 

INDEX DE POLARITE (%) = 40.61 : 

POINT ISOELECTRIQUE = 7.54 

DO 260 (Img/ml) = 0.509 DO: 280 (img/ml) » 0.721 



PROF I L D'HVDROPHILICITE DE Lfl PROTEINE 
COBK DE 1 ft 261 
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GENE cobL EX EROTEINE COBL 
SEQUENCE DU FRACMENT DE 8753 BP, DE 5862 A 7103 

MetAlaAspValSerAsnSerGliaProAlalleV^SerProTrpLeuThrVallleGlylleGlyGluAspGly 
ATGGCTGACGTGTCGAACAGCGAACCCGCCATAGTCTCCCCCTGGCTGACCGTCATCGGTATCGGTGAGGATGGT 
5862 5872 5882 5892 -5902 5912 5922 

ValAlaGlyLeuGlyAspGluAlaLysArgLeuIleAlaGluAlaProValValTyrGlyGlyHlsArgHlsLeu 

gtagcgggtctcggcgacgaggccaagcggctgatcgccgaagcgcCgGtcgtctacggcggccatcgtcatctg 

5937 5947 5957 5967 5977 5987 5997 

GluLeTAlaAlaSerLeuIleThrGlyGluAlaHlsAsnTrpLeuSerProLeuGltiArgSerValValGlviIle 
GAGCTCGCCGCCTCCCTCATCACCGGCGAAGCGCACAATTGGCTAAGCCCCCTCGAACGCTCGGTCGTCGAGATC 
6012 6022 6032 6042 6052 6062 6072 

ValAlaArgArgGlySerProValValValLeuAlaSerGlyAspProPhePhePheGlyValGlyValThrLeu 

GTCGCGCGTCGCGGCAGCCCGGTGGTGGTGCTTGCCTCGGGCGACCCGTTCTTCTTCGGCGTCGGCGTGACGCTG 

6087 6097 6107 6117 6127 6137 6147 

AlaArgArglleAlaSerAlaGluIleArgThrLeiiProAlaProSerSerlleSerLeuAlaAlaSerArgLeu 

GCGCGCCGCATCGCCTCGGCCGAAATACGCACGCTTGCGGCGCCGtCGTCGATCAGTCTTGCCGCCTCGCGCCTC 

6162 6172 6182 6192 6202 6212 6222 

GlyXrpAlaLeuGlnAspAlaXhrLeuValSerValHisGlyArgProLeuAspLeuValArgProHisLeiiHis 
GGCTGGGCGCTGCAGGATGCGACGCTCGTCTCCGTACATGGGCGGCCGCTGGATCTGGTGCGACCGCATTTGCAT 
6237 6247 6257 6267 6277 6287 6297 

ProGlyAlaArgValLeuThrLeuThrSerAspGlyAlaGlyProArgAspLeuAlaGluLeuLeuValSerSer 
. CCGGGGGCGCGTGTGCTTACGCTCACGTCGGACGGT5CGGGTCCGCGAGACCTTGCC6AGCTTCTGGTTTCAAGC 

6312 6322 6332 6342 6352 6362 6372 

GlyPheGlyGlnSerArgLeuXhrValLeuGluAlaLeuGlyGlyAlaGlyGluArgValThrXhrGlnlleAla 

ggcttcggtcagtcgcgactgaccgtgctcgaagcgctgggcggcGccggcgaacgggtgacgacgcagatcgcc 

6387 6397 6407 6417. 6427 ' 6437 6447 

AlaArgPheMetLeuGlyLeuValHisProLeuAsnValCysAlalleGluValAlaAlaAspGluGlyAlaArg 

gcgcgcttcatgctcggcctcgtgcatcctttgaacgtctgcgccattgaggtggcggccgacgagggcgcgcgc 

6462 6472 6482 6492 -6502 6512 6522 

IleLeuProLeuAlaAlaGlyArgAspAspAlaLeuPheGlTiHisAspGlyGlnlleXhrLysArgGluValArg 

atcctgccgctxgccgccggccgcgacgatgcgctgttcgaacatgacgggcagatcaccaagcgcgaggtgcgg 

6537 6547 6557 6567 6577 6S87 6597 

AlaLeuThrLeuSerAlaLeuAlaProArgLysGlyGluLeuLeuTrpAspIleGlyGlyGlySerGlySerlle 

gcgctgacgctgtcggcactcgcaccgcgcaagggcgaactgctatgggacatcggcggcggctccggctcgatc 

6612 6622 6632 6642 6652 6662 6672 

GlyIleGluTrpMetLeuAlaAspProThrMetGl%laIleXhrIleGluValGluProGluArgAlaAlaArg 

ggcatcgaatggatgctcgccgatccgaccatgcagGcgatcaccatcgaggttgagccggagcgggcagcgcgc 

6687 6697 6707 6,717 f6727 ' 6737 6747 

HeGlyArgAsnAlaThrMetPheGlyValProGiyi.euThrValValGluGlyGluAlaProAlaAlaLeuAla 

ATCGGCCGCAACGCGACGATGTTCGGCGTGCCCGGGCTGACGGTTGTCGAAGGCGAGGCGCCGGCGGCGCTTGCC 

6762 6772 6782 6792 6802 6812 6822 

GlyLeuProGlnProAspAlallaPhelleGlyGlyGlyGlySerGluAspGlyValMetGl'uAlaAlaUcGlu 

GGCCTGCCACAACCGGACGCGATCTTCATCGGCGGCGGCGGCAGCGAAGACGGCGTCATGGAAGCAGCGATCGAG 

6837 6847 6857 6867 6877 6887 6897 

AlaLeuLysSerGlyGlyArgLeuValAlaAsnAlaValThrXhrAspMetGluAlaValLeuLeuAspHisHis 

gcgctcaagtcaggcggacggctggttgccaacgcggtgacgacggacatggaagcggtgctgctcgatcatcac 

6912 6922 6932 6942 6952 6962 6972 



6987 6997 7007 7017 ':7027 

ProAlaMetProValThrGlnTrpSerXrpThrLySGly*** 
CCGGCCATGCCGGTCACCCAATGGTCGTGGACGAAGGGCTAA 
7062 7072 7082 7092 7102 



7037 



7047 



FIGURE 16.13 
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PROTEINE COBL 



PREMIER RESIDU 
DERNIER RESIDU 










NOMBRE 


% NOMB 


POIDS 


% POIDS 


Pfi£ 


F 


8 


1.94 


1176.56 


2.74 


LEU 


L 


47 


11.38 


5314.76 


12.39 


ILE 


I 


26 


6.30 


2940.08 


6.85 


MET 


M 


9 


2.18 


1179.36 


2.75 


VAL 


V 


34 


8.23 


3368.38 


7.85 


SER 


s 


25 


6.05 


2175.75 


5.07 


PRO 


p 


24 


5.81 


2329.20 


5.43 


THR 


T 


21 


5.08 


2122.05 


4.95 


ALA 


A 


56 


13.56 


3978.24 


9.27 


TYR 


y 


1 . 


0.24 


163.06 


0.38 


★ 


* 


0 


0.00 


■; 0.00 


0.00 


HIS 


H 


10 


2.42 


1370.60 


3.19 


GLN 


Q 


7 


1.69 


896.42 


2.09 


ASN 


N 


5 


1.21 


570.20 


1.33 


LYS 


K 


6 


1.45 


768.54 


1*79 


ASP 


D 


19 


4.60 


2185.57 


5.09 


GLU 


£ 


27 


6.54 


.3484.08 


8.12 


CYS 


C 


1 


0.24 


103.01 


0.24 


TRP 


H 


8 


1.94 


1488.64 


3.47 


ARG 


R 


28 


6.78 


4370.80 


10.19 


GLY 


G 


51 


12.35 


2908.02 


6.78 




— 


0 


0.00 


0.00 


0.00 



RESIDUS = 413 

POIDS MOLECUIAIRE « 42911. 

INDEX DE POLARITE (%) « 36. 

POINT ISOELECTRIQUE “ 5,70 

DO 260 (Img/ml) = 0.754 DO 280 (Img/ml) 



» 1.064 



COBU 

1 . 80 ^ 



OE 1 A 413 




figure. 16.14 
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GENE CQbM ET PROTEINE COBM 

SEQUENCE DU FiyVGMENT DE 8753 BP, DE 73L72 A 7930 

MetThrValHisPhelleGlyAlaGlyProGlyAl^aAspLeuIleThrValArgGlyArqAspLeuIleGlv 

atgacggtacatttcatcggcgccggcccgggagcOgcagacctgatcacggtgcgtggtcgcgacctgatcggg 

7172 7182 7192 7202 " 7212 7222 7232 

ArgCysProValCysLeuTyrAlaGlySerlleValSerProGluLeuLeuArgTyrCysProProGlyAlaArcr 

CGCTGCCCGGTCTGCCTTTACGCCGGCTCGATCGTQTCGCCGGAGGTOn'GCGATATTGCCCGCCGGGCGCCCGC 

7247 7257 7267. 7277 7287 .. 7297 7307 

IleValAspThrAlaPrc^tSerLeTiAspGliiIleGluAlaGluTyrV^LysAlaGluAlaGluGlyLeiAsp 
ATTGTCGATACGGCGCCGATGTCCCTCGACGAGATCGAGGCGGAGTAXGTGAAGGCCGAAGCCGAAGGGCTCGAC 
7322 7332 7342 7352 7362 . 7372 7382 

ValAlaArgLeuHisSerGlyAspLeuSerValTrpSerAlaValAlaGluGlnlleArgArgLeuGluLysHis 

GTGGCGCGGCTTCATTCGGGCGACCTTTCGGTCTGGAGTGCTGTGGCCGAACAGATCCGCCGGCTCGAGAAGCAT 

7397 7407 7417 7427 7437 7447 7457 

^ oGlyValPr oSerPheAl aAlaAl aAl aSerAlaLeuGlyAroGluLeuThr 

GGCATCGCCTATACGATGACGCCGGGCGTTCCTTCCTTTGCGGCGGCGGCTTCAGCGCTCGGTCGCGAATTGACC 
7472 7482 7492 7502 7512 7522 7532 

IleProAlaValAlaGlnSerLeuVaiLeuThrArgValSerGlyArgAlaSerProMetProAsnSerGluThr 

ATTCCGGCCGTGGCCCAGAGCCTGGTGCTGACCCGCCfTTCGGGCCGCGCCTCGCCGATGCCGAACTCAGAAACG 

7547 7557 7567 7577 7587 7597 7607 

LeuSerAlaPheGlyAlaThrGlySerThrLeuAlalleHisLeuAlalleHisAlaLeuGlnGlnValValGlu 

CTTTCCGCTTTCGGCGCTACGGGATCGACGCTGGCSATCCACCTTGCGATCCATGCGCTTCAGCAGGTGGTCGAG 

7622 7632 7642 7652 7662 7672 7682 

GluLeuThrProLeuTyrGlyAlaAspCysProValAlalleValValLysAlaSerTrpProAspGluArqVal 

^CTGACGCCGCTCTACGGTGCCGACTGCCCGGTCGCCATCGTCGTCAAGGCCTCCTGGCCGGACGAACGCGTG 

7697 7707 7717 7727 7737 7747 7757 

ValArgGlyThrLeuGlyAsplleAlaAlaLysValAlaGluGluProIleGluArgThrAlaLeuIlePheVal 

GTGCGCGGa\CGCTCGGTGACATCGCCGCCAAGGTGGCGGAAGAGCCGRTCGAGCGCACGGCGCTGATCTTCGTC 

7772 7782 7792 7802 7812 7822 7832 

GlyProGlyLeuGluAlaSerAspPheArgGluSerSerLeuTyrAspProAlaTyrGlnArgArgPheArgGlv 

^TCCGGGGCTCGftAGCCTCCGATTTCCGTGAAAGCTCGCTCTACGATCCCGCCTATCAGCGGCGCTTCAGAGGG 

7847 7857 7867 7877 7887 7897 

ArgGlyGlu 
CGCGGCGAA 
7922 7932 



7867 


7877 


7887 


7942 


7952 


7962 



7907 



7972 



7982 



FIGURE 16.15 
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PROTEINE 


com 


PREMIER RESIDU 


= , 1 


p 








DERNIER RESIDU 


» f 53 










NOIBRE 


% NOME 


poidS 


% POIDS 


1 


PHE 


F 


6 


2.37 


882.42 


3.29 


2 


LEU 


L 


24 


9.49 


2713. 92 


10.11 


3 


ILE 


I 


15 


5.93 


1696.20 


6.32 


4 


MET 


M 


4 


1.58 


524.16 


1.95 


5 


VAL 


V 


22 


8.70 


2179.54 


8.12 


6 


*SER 


s 


18 


7.11 


1566.54 


5.84 


7 


PRO 


p 


17 


6.72 


1649.85 


6.15 


8 


THR 


T 


13 


5.14 


1313.65 


4.89 


9 


ALA 


A 


35 


13.83 


2486.40 


9.26 


10 


TYR 


Y 


7 


2.77 


1141.42 


4.25 


11 


* 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


R 


5 


1.98 


685.30 


2.55 


13 


GLN 


Q 


5 


1.98 


640.30 


2.39 


14 


ASN 


N 


1 


0.40 


114.04 


0.42 


15 


LYS 


K 


4 


1.58 


512.36 


1.91 


16 


ASP 


D 


11 


4.35 


1265.33 


4.71 


17 


GLU 


£ 


19 


7.51 


2451.76 


9.13 


18 


CYS 


C 


4 


1.58 


412.04 


1.53 


19 


TRP 


w 


2 


0.79 


372.16 


1.39 


20 


ARG 


R 


19 


7.51 


2965.90 


11.05 


21 


GLY 


G 


22 


8.70 


1254.44 


4.67 


22 


• 




0 


0.00 


0.00 


0.00 



RESIDUS 

POIDS J40LECULAIRE 
INDEX DE POLARITE (%) s 
POINT ISOELECTRIQUE 
DO 260 (Img/ml) = 0.461 



253 

26846. 

38. 

5.58 

DO 280 (Img/ml) *= 6.724 



COBH DE ID 2S3 






PCT/FR91/00054 
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-f 





10 20 30 40. 

COBA LPALEKGSVWL-VGAGPGDPGLLTLHAANAIJ^QADVIVH 

GOBI VSGVGVGI^-IGVGTGPGDPELLTVKAVKALGQi^i^VI^ 

10 20 30 40 



region 1 



90 100 no 120 130 140 150 

COBA LAI^GimVLKI^GGDPFVFGRGGEEALTLVEHQVPFRIVPGITAGIGGLAYAGIPVTHKEVNHAVW 

GOBI IA-AGRTVAVLSEGDPLFYGSYMHLHVRIJ^-FPVE\aPGITAMSGCWSLAGLPLVO-G-DDVLSVLPG 
no 120 130. 140 150 160 



region 2 



region 3 



FIGURE 21 
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ALIQJEMEOT ENTRE LES PROTEINES COBA DE PSEDIXM5NAS DENlTRIFICaNS ET CYSG DE 
ESCHERICHIA COLI 



SEQUENCE OOBA 
SEQUENCE CYSG 
10 






1 






60 



70 



DDLFAGlPAI^GSVWLVGAGPGDPGIJ^LHAAi!?ALRQ*DVIVHDALVNmCIjKIARPGAVLEFAGKRGG 



EQLI^E-PII) HRGEVVLV6AGPGDAGIXTIRGIX30I00ADVWXDRLVSDT1T^ l^IT.VRR^>anT^ww:OT?arl 

210 220 230 ^ 240 *250 260 270 

80 90 . 100 2 110 120 130 140 

KPSPKQRDISU?LVEIAMjGNRVIRIiCGGDPFVFGRGGEEALTljVEHaVPFRIVt6lTAGlGGLAYAGlP 



YHCVPQEEINQILLREAQ HGKRVVRLKG6DP T=^TPfiRfyff ^Ij;Tl| CKRGIPFSVvt>GITAA5>G r<;a Yg<;TP 

280 290 300 310 320 

150 160 170 180 190 



^30 370 

200 210 

TTHREpNHAVTFLTGHDSSGLVPDRINWQGIASGSPVIVMXMftKIKHIGAITANLIAGGRSPDEPVAFVCN 



LTHRDtAQSVRLITGHLKTG-G-E-LDWENLAftEKQTLVFYMGiNQAATIQQKLIEHaiPGEMPVAIVEN 

850 360 370 380 390 400 

220 230 240 250 

AATPQQAVLETTIARAEADVAAAGIEPPAIWVGEWRIRAALDWIG 



GmVTQRVIDGTLTQL-KffiLAQQ-MNSPSLIIIGBWGIJ^KLNWFS 
420 430 440 450 



SEQOENCE COBA DE 3 A 259 
SEQUENCE CYSG DE 204 A 460 

HOMOLOGIE STRICTE EN ACIDE AMINES : 41.6% 



FIGURE 22 
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>•1 



c RFcl i- o |ol5| 
o ou. a._i> c 



o 


^g X x^ 


J 


o 


— -J_I 
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o 
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>g 
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o 


o o o 
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X 


g 


C C (C 


>[g 


o 
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^ ^ ^ ^ 
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w V/ w 
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CO CD CQ CD CQ CQ CQ 
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o 


o 
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m 


o 


O 
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o 
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g 


o 
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CD 
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I ^ O CO O O' 
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10 20 30 
GTCGACGA6T AT66TCAGGT TCAG6GTCTG 
CAGCTGCTCA TACCAGTCCA AGTCCCAjSRC 

^0 80 90 
GTC6GCGATA TCGCCGATGA GCACGACCTC 
CAGCCGCTAT AGCGGCTACT CGTGCTGKsAG 

-• -Ij.? 

130 140 ISO 

GGCTCGATCG TCGTCGATGG CTCGGTGCCG 
CCGAGCTAGC AGCAGCTl«: GAGCCACGGC 

190 20C 210 

TCGCTGCCGG ACGAGGAGGC GACGACGGTG 
AGCGACGGCC TGCTCCTCCG CTGCTGCCAC 

250 260 270 

ATTCCGGAGG AGCGCCAGGC CTTCACCTTC 
TAAGGCCTCC TCGCGGTCCG GAA6TGGAAG 

310 320 330 

6TGAA6AACC GCATTACCAA GCTGCGCATC 
CACTTCTTGG CGTAATGGTT CGACGC6TAG 

370 380 390 

TGATGGCC6C 6ATTGCCTCT ACCAGCGGGT 
ACTACCGGCG CTAACGGAGA T6GTCGCCCA 

430 440 450 

GAGCGCATGC AGGCCGGCGT CGAGTTCTGG 
CTCGCGTACG TCCGGCCGCA GCTCAAGACC 

490 500 510 

GGCGACACGG CTCATGCCGG CAAAGGCGCT 
CCGCTGTGCC GAGXACGGCC GTTTCCGCGA 

550 560 570 

GCCGGTACCA -TCGAAGCCCG GCTGATGGCC 
CGGCCATGGT AGCTTCGGGC CGACTACCGG 

610 620 630 
6AGCCGTTCA GGGTGGAA6C CCTCGATCA6 
CTCGGCAAGT CCCACCTTCC GGAGCTAGTC 

670 680 690 

TCTTCCGTCC CATTTTGCTG TTT G CTT6GC 
AGAAGGCA6G GTAAAACGAC AAACGAACG6 

730 740 750 

CTGGCACGGC GGC6CAAAAT GCCCGCACAA 
GACCGTGCCG CCGCGTTTTA CGGGCGTpTT 

790 800 8ib 

GTTGTGACTC CCGCCAAACC CCATAAT^G 
CAACACTGAG GGCGGTTTGG GGTATTaStC 

850 860 

TCGCATTCGA ACCCGGCGCA AGGTO^GCC 
AGCGTAAGCT TGGGCC6C6T TCCAGCTCG6 

910 920 930 

ItSGGACGGCT GCGATCAGAA GGGTGTGCAC 
ACCCTGCC6A C6CTAGTCTT CCCACACGTG 



PL. Bljir} 

40 50 60 
GTGACGCTGG AGGACATTCT 6GAGGAGATC 
CACTGCGACC TCCTGTAAGA CCTCCTCTAG 

100 no 120 

GACATTCAGG GCGTGCGCCA GGAAGCCGAT 
CTGTAAGfCC CGCACGCGGT CCTTCGGCXA 

160 170 180 
ATCCGCGATC TCAACCGCGC GCTCGACTGG 
IAGGCGCTAG AGTTGGCGCG CGAGCTGACC 

220 230 240 
GCCGGTCTGG TCATCCACGA GTCCAAGAGC 
CGGCCAGACC AGTAGGTGCT CAGGTTCTCG 

280 290 300 
CACGG OAA C GCTTCATCGT GATGAAGCGG 
GTGCCGTTTG pGAAGTAGCA CTACTTCGCC 

340 350 360 
C6TCCGGCGG AAGAGGGTGC TCCGCCGGCG 
GCA6GCCGCC TTCTCCCACG AGGC6GCCGC 

400 410 420 
CGGCTCGCCG GGGGCTGCCG GCTCGACGGC 
GCCGA6CGGC CCCCGACGGC CGAGCTGCCG 

460 470 480 
CTTCAGGAGA TCATTGATGG CGCGGTGGCG 
GAAGTCCTCT AfflCAACTACC GCGCCACCGC 

520 530 540 
AGAAAC6ATA CGCACCCGCA T6TGGGACTC 
TCTTT6CTAT KGtGGGCGT ACACCCTGAG 

580 590 600 
GGTAttSCTGA TGGCTCTCGT T§ATGACCTC 
CCATACGACT ACCGAGAGCA ACTACTGGAG 

^^0 650 660 
CTTCTTTTC6 ATGGTCTCGG TGA6CGACAT 
GAAGAAAAGC TACCAGASCC ACTCGCT6TA 

700 710 720 
GCCCCCTCGC AGTTAAGAAC CCG6TAATCG 
CGGGGGAGCG TCAATT C TT G GGCCATTAGC 

760 770 780 
AGCCAGCAAC ATTCCGCTTT GTCAATTCTT 
TCGGTCGTT6 TAAGGCGAAA CAGT3AAGAA 

820 830 840 
CGCCATGAGA CICGATTCAA AA3ACTTCGA 
GCGGXAC^ GAGCTAAGTT TIATGAAGCT 

880 890 900 
GCAGCAGAGC C6GCG6CTCC CGTCTeiCAG 
CGTC6TCICG 6CCGCCGAG6 GCAGACAGTC 

940 950 960 
CG6GCGCCCG TCGGTCGCAA CGCCGAGGGG 
GCCCGCGGGC AGCCAGCGTT GCGGCTCCCC 
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PL. 82/li'f 

CGAGC&CGTG AAGGAATACA ACAAGG^A CAACTTCTTC 

gtcatgaagt acaagacgaa GercGTcpc ttccttatgt' tgttcc^t gtSS 

ssi ssii si 

1150 
CGGTCTGGCT 
GCCAGACCGA 



1210 

GCGCGGGCGC 

CGCGCCCGCG 



.160 13,70 1180 1190 i9nn 

CTGCCGSC6C GCAGGCCCGC ATGCGC6ATC CCTTCGGCTT TCTCAcerar 
aCBKCCCG (KTCOiKCG SS SS 

^220 1230 124Q 1250 

GATCCGGTCG.:TCCCGAGCCA CGCCAGCGCA AGC!TGAAGAC GCTCCArrJr 
CTAGPCCAGC AGGGCTCGGT GCGGTCGCGT TCGACTTCTG CGAGCTCCGC 

w s§ii sii ™ 
sdi ssE gs 

K sg isi 

sig gsE sii sisi ?sii 
sra si ^ 

1700 1710 1720 1 

CACAACCGAC GC6TGATGGT . GTCGGGCTAT CArGGCACCG 
GGTAAGAGCG TCCGAAGCGG GTGTTGGCTG CGCACIA^ CAGcSi SoSSS? 

1750 1760 1770. 17B0 non lann 

G CAA GTCCAC CCATATCGAG CAGGTCGCCG CGCGCCTGAA ‘CIGGCCGTRT rrftreriSS* 
CeiKMSTG GOnTASCIC GTCaGCOSC SeiS S^SgSS 

. ^810 1820 1830 ■ 1840 loon 

ACCXCGATAG CCATGTCAGC CGTATCGACC TCGTCGGGAA ^GGACSe^^ r rr r G ^ j 
laaocmc GOj»e«aci! scwttgg ilragSSgS 

1870 1680 1890 1900 loin gaaa 

ACGGCCTGCA 66TCACCGAA TTCAAGGACG GCATCCTGCC CTGGGCCTAC CJlsnrifSr 
tgccggacgt ccagtggctt aagttcctk cgia^ SSSStc SSS? 
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PL. B3 1 irj 



1930 1940 1950 1960 1970 1980 

CTTCGACGWk TACGAIWCG GtCGCCCGGA . CGTCATGTTC GTCATCCAGC 
AGCGCGAGCA GAAGCTGCTT ATGCTASS?^ CGGCGGGCCT GCAGIACAAG CAGTAGGTCG 

2000 2^0: 2020 2030 2040 
ATCCTCCGGC CGCCTGAdGC TGCTCGACCA 6AGCCGTGTC ATGCGTCCGC 
CGCACGACCT TAGGAGGCCG 6CGGACT®G AC6AGCTGGT GiCGGCACAG TA6GCAGGCG 

2050 2060 2070 2080 2090 2100 

ACCCGGCCTT CCGCCTGTTT GCGACCGCCA ACACC6TC6G CCTCGGC6AC ACGACCGGCC 
TGGGCCG6AA GGCGGACAAA CGCTGGCdGT TGTGGCAGCC feGAGcSSS tStSSk 

2110 2 20 2130 2140 : 2150 2160 

TCTATCACG6 CACGCAGCAG ATCAACCAGG CGCAGATGGA CCGCTGGTC6 ATCGTCACCA 
AGAXAGTGCC GTGCGTCGTC TAGTTGGICC GCGTCITACCT GGCGACCAGC TAGCAGTGGT 

2170 2180 ' 2190 2200 2210 2220 

CCTGCCGCAC GACAAGS^G TCGACATCGT CGCCGCCAAG gtcaagggct 
GCGACTTGAT GGACGGCGTG ctgttccttc agctgtagca gcggcggttc cagttcccga 

2230 2240 2250. .2260 2270 2280 

TCACCGCCGA CAAGGGCC6C GAGACCGTCT CCAAGATGGT ACGTGTCGCC GACCTCACGC 
AGTGGCGGCT GTTCCCG6CG CTCTG6CAGA GGTTCTACCA TGCACAGCGG CXGGAGTGCG 

2290 2300 2310 2320 2330 2340 

6CGCAGCCTT CATCAATGGC GATCTCTCGA CTGTCATGAG CCCGCGTACG GTCATCACCT 
CGCGTC6GAA 6TAGTTACC6 CTAGAGAGCT GACAGTACtC GGGCGCATGC CAGTACT^ 

2350 2360 2370 2380 2390 2400 

“CCCACAIC TTC6GC6ACA TCGCTTTCGC CTTCCGCGTG ACCTTCCTCA 
CCCGGCTCTT GCGGGTGIA6 AAGCCGCJST AGCGAAASC6 GAAGGCGCAC TGGAAGGAGT 

2410 2420 .. 243^0 2440 2450 2460 

A CAA GTGCGA CGAGCTGGAG CGGGCGCTGG TCGCOGAGCA CTACCA6CGC GCCTTCG6CA 
TGTTCACGCT GCTCGACCTC GCCCGCGACC AGC6GCTCGT GATGGTCGCG CGGAAGCCGT 

2470 2480 2490 2500 2510 2520 

TCGAGCTGAA GGAATGCGCT GCCAACATCG TGCTCGAAGC CACCGCCTGA TCCCACGGCC 
AGCTCGACTT CCTTAC6CGA CGGZiGTA^ ACGAGCTTCG 6T6GCGGACT A6G6TGCCG6 

2530 2540 2550 2560 2570 2580 

^^SGSAGGG C6GGTCA5^ CGCTGTGGCA AACCGGATGA CGCCCCACTG 
ACGGCAGGGG AAACCCTCCC GCCCAGfAei iGCGACACCGT TTGGCCTACT GCGGGGTGAC 

2590 2600 2610 2620 2630 2640 

GG6CGCC6TC GCCTCTGGCT GAAGAAG6AA CTGTCGTGAG CTCGAATICG AAG6CAAAGC 
CCCGCGGCAG CGGAGACCGA CTTCTTCCTT GACAGCACTC GAGCTTAAGC TTCCGTTTCG 

2650 2660 2670 2680 2690 2700 

CAACCACGCG CGAGAATGCT 6CGGAACCGT TCAA6C66GC SCTTTCCSGC TGCATCC6AT 
GTTGGTGCGC GCTCTTAC6A CGCCTTGCpl AGTTCGCCCG CGAAAGGCCC ACGTAGGCTA 

2710 2720 2730 2740 2750 2760 

^TCGCGGG CGATGCCGAG GtGGAAG^ CCTTCG,CCAA CGAGCGGCCG GGCATGACCG 
GCXAGCGCCC GCTACGGCTC CACCTTCAGC GGAAGCG6TT, GCTCGCCGGC CCGIACTGGC 

2770 2780 2790 2M0 2810 2820 

GCGAACGCAT CCGTCTGCCG GAACTTTCCA AGCGCCC6AC CCT6CAG6AA CTTGCCGTGA 
CGCTTGCGTA GGCA(^CGGC CTTGAAAGGT ICGCGGGCTG GGAC6TCCTT GAACGGCACT 

2830 2840 2850 286Q . 2870 2880 

CCCGCGGGCT CGGT6ACAGC ATGGCGCfGC GCAAGGCCTG TACGCAIGCG CGGATCCAGC 
GGGCGCCCGA GCCACTGTCG lACCGCGACG OnTCCGGAC XTGCGIACGC GCCXAGGTCG 
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2890 2900 2910 
gcaccatgtc gccgcaaggg gcggacgccc 

CGTGGTACAG CGGCGTTCCC CGCCTGCGG6 

2950 2960 29^ 
GTGTCGAGGC GATCGGGTCG TTGCGCATGG 
CACAGCTCCG CTAGCCCAGC AACGCSIACC 

3010 3020 303b 
TCGAAGAGAA ATACGCCAAG GCGAATTTCG 
AGCTTCTCTT TATGCGGTTC CGCTTAAJ^GC 

3070 30-0 3090 
TCGGC6A6GC CGTAGCGC G CTGGTGO^G 
AGCCGCTCCG GCATCGCGAC 6ACCACGCGC 

3130 . 3140 3150 
CTGCCGGCAA GGTGCTCGAC CTCTGGCGCG 
6ACGGCCGTT CCACGAGCTG GAGACCGCGC 

3190 3200 3210 
TTGAGCACCT GTCGTCGAC6 ATCAACAACC 
AACTCGTGGA CAGCAGCTGC TAGTTGTTGG 

3250 3260 3270 
TGCTGACCTC GATGGAAGTC GCCGAGAAAT 
ACGACTGGAG CIACCTTCAG CGGCTCTITA 

3310 3320 3330 
AGGAAAGCGA GACCGACGAA GACCAGCCGC 
TCCTTTCGCT CTGGCTGCTT CTGGTCGGCG 

3370 3380 3390 
ACGAGGAAGC CGGCGACGAT GCCGCACCCG 
TGCTCCTTCG GCCGCTGCTA CGGCGTGGGC 

3430 3440 3450 
TGGAAGAAGG CGAGATGGAC G6CGCGGAGA 
ACCTTCTTCC GCTCTACCTG CCGCGCCtCT 

3490 3500 3510 
ACGAGGACAG CGAAACGCCC GGCGAGGTCA 
TGCTCCTGTC GCTTTGCGGG CCGCTCWGT 

3550 3560 3576 
AC6AGAAGGT CGACTACGCC GTCTTCACCC 
TGCTCTTCCA GCTGAT6C66 CA6AA6TG66 

3610 3620 3630 
AGCTTTGCGA C6AGGCCGAG CTC6ACC6GC 
TCGAAAC6CT GCTCCG6CTC GAGCTG6CC6 

3670 3680 3690 
ATCTTCAAGG CGCGGTCG6C CGCCTTSCCA 

XAGAA6TTCC 6CGCCAGCCG GCGGAACGGT 

■- , • 

3730 3740 3756 
AGAACCGCTC CTGGGAGTTC GATCTC6AAG 
TCTTGGC6A6 GACCCTCAAG CTAGAGCT^ 

3790 3800 3810 
GCATCATCAT CGATCCGATG CAGCCGCTTt 
CGTA6TAGTA GCTAGGCTAC GTCGGCG^ 






PL. ba/ZJ'I 

2920 2930 2940 
GCGCGATCTT CGATGCGGTG GAGCAGGCTC 
CGCGCTAGAA GCTACGCCAC CTCGTCCGAG 

2980 2990 3000 
CGGGTGiTGGC CAAGAACCTC AACGTCATGC 
GCCCAplGCG GTTCTTGGAG TTGCAGTACG 

3040 3050 3060 
CAACGATCGA GCGCCAGGCG GACGCGCCGC 
GTTGCTAGCT CGCGGTGCGC CTGCGCGGCG 

3100 3110 3120 
AGAAGCT6AC G6GCCA6AAG CCGCCG6CGT 
TCTTCGACTG CCC6GTCTTC GGCGGCCGCA 

3160 3170 3180 
AGTTCATCGA GGGCAAGGCT GCCGGCGACA 
TCAAGTAGCr CCC6TTCCGA CGGCCGCTGT 

3220 3230 3240 
AGCAGGCCTT T6CCC6GGTC GTTCGCGACA 
TCGTCCGGAA ACGGGCCCAG CAAGCGCTGT 

^280 3290 3300 
ACGGTGACGA CGACAACGAG CC66ACGAGC 
TGCCACTGCt GCTCmCTC GGCCTGCTCG 

3340 3350 3360 
GCAGCCAGGA GCAGGACGAG AACGCCAGCG 
CGTCGGTCCT GGTCCTGCTC TTGCGGTCGC 

3400 3410 3420 
CCGACGAGAA CCAGGCTGCC 6AAGAGCAGA 
GGCTGCtCTT GGTCCGACGG CTTCTCGTCT 

3460 3470 3480 
TCTCCGACGA CGATCTCCAG GACGAAGGCG 
AGAGGCTGCr GCIAGAGGTC CTGCTTCCGC 

3520 3530 3540 
AGCGTCC6AA CCAGCCCTTC GCCGACTTCA 
TCGCAGGCTT GGTCGCGAAG CGGCTGAAGT 

3580 3590 3600 
GCGA6TTCGA CGAGACGATT GCCTCGGAAG 
CCCTCAAG|^ GCTCT6CTAA CG6AGCCTTC 

3640 3650 3660 
TGCGCGCCTT CCTCGACAA6 CAGCTTGCCC 
ACGCGCGGAA GGAGCTGTTC GTCGAACGGG 

3700 3710 3720 
ACCGGCTGCA 6C6CC6CCTG ATGGCGCAGC 
TGGCCGACGT CGG6GCGGAC TACCGC6TCG 

3760 3770 3780 
AGGGGTATCT CGATTCGGC6 CGGCTTCAGC 
TCCCdVTAGA GCTAAGCCGC 6CCGAAGTCG 

3820 3830 3840 
CCTTCAAGCG C6AAAAGGAC ACCAACTTCC 
GGAAGTTCGC GCTITTCCTG TGGTTGAAGG 
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3850 3860 3870 

GCGATACCGT CGTCACGCtG CTGATCGACA 
CGCTATGGCA GCACTGCGAC GACTAGCTGT 

3910 3920 3930 

CGGTTGCCGC CACCTGCGCC GATATCCtGG 
GCCAACGGCG GTGGACGCGG CTATAGGACC 

3970 3980 3990 

TCGAGATCCT CGGTTTTACC ACCAAGGCGT 
AGCTCTAGGA GCCAAAATGG TGCTTCTOCA 

4030 »040 4050 

TGGCCGGCGG CAAGCC CAG GCCCCGGGTC 
ACCGGCCGCC GTTCGGl'GTC CG66GCCCAG 

4090 4100 4il0 

AGTCTGCCGA CGCTCCGTGG CGCCGGGCAC 
TCAGACGGCT GCGAGGCACC GCGGCCCGTG 

4150 4160 4170 

6CCT6CTCAA 6GAAAACATC GACGGCGAGGi 
CGGACGAGTT CCTTTTGTAG CTGCGGCfCC 

4210 4220 4230 

CGCGGCGCGA ACAGCGGCGC ATCCTGATGA 
GCGCCGCGCT TGTCGCCGCG TAGGACTACT 

4270 4280 4290 

CGACGCTGTC GGTCAATCCA G6AAACTATC 
GCTGCGACAG CCAGTTAG6T CCTTTGATA6 

4330 4340 4350 

AGATCGAAAC GCGCTCGCCG GTG6AACTGC 
TCTAGCTTTG CGCGAGCGGC CACCTTG^CG 

4390 4400 4410 

GCTACTATCG CC6TGCCGTC ACCATCGfCG 
CGATGATAGC GGCACGGCAG TGGTAGCAGC 

4450 4460 4470 

AACAGCTGGC CGCACTCTTC GAGGACG^ 
TTGTCGACCG GCGTGAGAAG CTCCTGC;^ 

4510 4520 4530 

GCGCCG6GTG ATGCTTCCCC CTTGGGGGCG 
CGCGGCCCAC TACGAA(^ 6AACCCCC6C 

4570 4580 4590 

CACCTGCACG CATCGCTGGC G6CC6AAGTC 
GTGGACGTGC 6TAGCGACCG CCGGCTTCAG 

4630 4640 4^0 

AGCTACCATG C6TGGCGGGC TCACTTIGAG 
TCGATGGTAC GCACCGCCCG AGTGAAACTC 

4690 4700 4710 

AAGGIACTTC TCTTGATGCT TGGCCGCG6T 
TTCCATGAAG AGAACTACGA ACCGGCGC'CA 

4750 4760 4770 

TGCCCGGC 
ACGGGCCG 



PL. 

36ww 3890 3900 
ATTCCGGCTC.GATGCGCG6C CGTCCGATCA 
TAAGGCCGAG.CTACGCGCCG GCAGGCTA6T 

3940 3950 3960 
CGCGCACGCT CGA6CGCT6C GGC6TCAAGG 
GCGOGTGI^IA 6CTCGCGACG CCGCAGTTCC 

4000 4010 4020 
GGAAGGGVGG GCAGTCACGC GAGAAGTGGC 
CCTTCCCACQ :CGTCAGTGCG CTCTTCACCG 

4060 4070 4080 
GCCTCAACGA CCTGCGACAC ATCGTCTACA 
CGGAGTTGCTGGACGCTGTG TAGCAGATGT 

4120 4130 4140 
OACGCAATCT CGGCCTGATG ATGCGGGAAG 
CTGCGTTAGA GCCGGACTAC TACGCCCTTC 

4180 4190 4200 
CGTTGATTTG GGC6CATGAG CGGCT6ATGG 
GCAACTAAAC CCGC6TACTC GCCGACTACC 

4240 4250 4260 
TGATTTCGGA CGGCGCGCCG 6TCGACGACT 
ACTAAAGCCT GCCGCGCGGC CAGCTGCTGA 

4300 4310 4320 
TG6AGCGTCA CCTGCGCGCG GTCATCGAGC 
ACCTCGCAGT GGACGCGCGC CA6TA6CTCG 

; 4360 4370- 4380 
TGGCGAtCGG TATCGGCCAC GACGTGACGC 
ACCGCTAGCC ATAGCCGGTG CTGCACTGCG 

4420 4430 4440 
AT6CCGAT6A GCTT6CCGGC GC6ATGACCG 
TACGGCTACT CGAACGGCCG CGCIACTGGC 

4480 4490 4500 
GCCAGCGCCG CGGTTCTTCG CGTCTTCGCC 
CGGTCGCGGC GCCAAGAAGC GCAGAAGCGG 

4540 4550 4560 
GTGGAACATC GCCTCCGAGC TGCCAATCGG 
CACCTTGTA6 -CGGAGGCTCG ACGGnAGCC 

4600 4610 4620 
AATTTACGGA CATA G TTTTA CAGTCTACCA 
ITAAATGCC; .0IATCAAAAT GTCAGATGGT 

4660 4670 4680 
CGCACGCCGC GTCATTCCCG ATGCCCCCTG 
GCGTGCGGCG CAGTAAGGGC TACGGGGGAC 

4720 4730 4740 
CTCCTAGCCC TTTTCCTCCT GGCTTCGGCC 
GAGGATCGG6 AAAAGGAGGA CCGAAGCCGG 

47pD' 4790 4800 
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PL. Bfi/fXl 

20 . 30 40 50 60 
6AGCTCATAG AGCAGTTCCT CGATCGAClfT CAGCAGICGC ATGAAATCCA TGCCGTGCTC 
CTCGAGTATC TCGTCAAGGA GCTAGCTiSAA GTCGTCAGCG TACTTTAGGT ACGGCACGA6 



10 



70 80 
CCCTTGCTTC lATGCGTGGC 
6GGAACGAAG ATACGCACC6 

130 140 
CGCAGCTCGT CGGTACGCAT 
GCGTCGA6CA GCCATGC*nA 



9t) 100 , 110 , 120 
ACGACCGCGC GCCGGGGCC6 ATGCCGGTCA GTCGCGCAGA 
TGCTGGCGCG CGGCCCCGGC ; lACGGCCAGT CAGCGCGTCT 

150 160 170 180 
CTGCA6CATC TCCAGCGTC6 ACAGGAAGCT CATGCCGAGC 
GACGTCGTAG AGGTCGCAGC TGTCCTTCGA GIACGGCTCG 



190 200 210 J2Q 230 240 
AGGCTCTGAT CGAGCTTGCC CTT6GCTGCG ACCGTTGCGC CGATGTZGCG GC6GGTGATC 
TCCGA6ACTA GCTCGAACGG GAACCGACGC TGGCAACGCG GCTACAACGC CGCCCACIAG 



250 260 270 

GGGCCGATCG AGATCTCCTG AAGCATCACG 
CCCGGCTAGC TCTAGAG6AC TTCGTAGXGC 

• 

310 320 ' 330 

ATGACCGTGA CGATAAAGTT GAGGTTGGCC 
TACTGGCACT GCTATTTCAA CTCCAACGGG 

370 380 390 

TAGGTGAGCG CGATGTTGCT GGCGCCGGTA 
ATCCACTCGC GCTACAACGA CCGC6GC±AT 

430 440 450 

ACCGTCGCAG TGGTCTCGAA ATGACCGTTC 
TGGCAGCGTC ACCAGAGCTT TACTGGCAAG 

490 500 510 

CCCTCGCTGT CAGTGATGAT GGTGGCGCGG 
GGGAGCGACA GTCACTACTA CCACCGCGCC 

550 560 570 

CCGAAGCCCT CCAACTCGAA GCGGTAGACA 
GGCTTCGGGA GGTTGAGCTT CGCCATCjGT 

€10 620 630 
AGCCAGATGG CGATCTGACG CAGGCCT^G 
TCGGTCTACC GCTAGACTGC GTCCGGAA^ 

€70 680 690 

GC6CC6ATCA 6CGT6GCGAT 6GC6CCGA6C 
C6CGGCTAGT CGCACCGCTA CCGeGGCtCO 

730 740 750 

A6CCCCATGG TGCGGCCGGT 6TC6T6GTTG 
TCGGGGTACC AC6CCG6CCA CAGCACCAAC 

790 800 810 

ATCGAGAGCA GGATGGCAAG ACGGGTCATG 
TAGCTCTCGT CCXACCGTTC TGCCCAGIAC 

850 860 ^0 

GTCGGGTTTC GCGCCGCGGC TTGC6TTCGA 
CAGCCCAAA6 CGCGGCGCCG AACGC^I^ 

910 920 930 

TGATCGC6CG GCGTTCGGCA TCOOKEAZ^ 
ACIAGCGCGC C6CAA6CC6T AGCC^:^ 

FIGURE 



280 : 290 300 
GGGGCTGCCT GGGCCCGGCC ATTGGCTGTC 
CCCCGAC6GA CCCGGGCCGG TAACCGACAG 

340 350 360 
GGGTCGAGGC CGATCTTTTC CGCATCTTCA 
CCCAGCTCCG GCTAGAAAAG GCGTAGAAGT 

400 410 420 
TCGACCAGCA TGCTGATGTC CTTGCCGTCG 
AGCTGGT^GT ACGACTACAG GAACGGCAGC 

460 470 480 
AGCATCTTCT GCAGCACCAC TTCCTGCTGT 
TCGTAGAAGA CGTCGTGGTG AAGGACGACA 

520 530 540 
CCGGGGATGA GGCCGGCGAG CAGGCGGTTA 
GGCCCCIACT CCGGCCGCTC GTCCGCCAAT 

580 590 600 
TAGGCCGAGA CCAGC(^CAG AACGACGAAG 
ATCCGGCTCT GGTCGCGGTC TTGCTGCTTC 

640 650 660 
CCGAAGCGGT GGCGGCTCTG CAGGATGCCG 
GGCTTCGCCA GCGCCGAGAC GTCCTACGGC 

700 710 720 
GAGACCAGTT GCCCGAACT6 GTCATTGGCA 
CTCTGGTCAA CGGGCTTGAC CAGTAACCGT 

760 770 780 
ATGATCAGCA GGATGAG6CC 6ATG6CCAGG 
TACTAG5tGT CCTACTCCGG CTACCGGTCC 

820 830 840 
CTTCGCCGCG 3TCCCTCGCC ATGCGCGTGC 
GAAGCGG^C AAGGGAGCGG TACGCGCAC6 

880 890 900 
CGGTCTCAAG CCGTGCAGGC AACGCGCTCA 
GCCAGAGTTC GGCACGTCCG TTGCGCGAGT 

940 950 960 
GCGTCCAGCG tCCGACTTCG TCGCGGGTAC 
CGCAGGTCGC AGGCTGAAGC AGCGCCCATG 
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PL.6ll(S\ 

970 980 990 • . lOOO; 1010 1020 

GGCCGCAGCC GAAACAGTAG CCGGTCTtGT OlTCGStCGA ACAGACGAGA ATGCAGGGAG 

CCGGCGTC 66 CTTTGTCATC GGCCAGAACA GTAGCTAGGT TGTCTGCTCT ZACGTCCCTC 

1030 1040 1050 1060 1070 1080 

ATTCCATGGG cgtgctcagt tttccct:^ tatatcgatg tttcaaaccg tcagcgcaag 

* TAAGGTACCC GCACGAGTCA AAAGGGA^T ATATAGCTAC AAAGTTTGGC AGTCGCGTTC 

• 1090 1100 nio 1120 1130 1140 

» GGCACCGAGC ACGGCGATTT CGGTCAGftG CTGCGTCGCC CC 6 ATCGTGT CGCCCGTTTG 

CCGTGGCTCG TGCCGCTAAA GCCAGTC^C GACGCA 6 CS 6 GGCTAGCACA GCGGGCAAAC 

*■ 1150 1160 1170 ,1180 1190 1200 

TCCGCCGATC TTGCGCATCG CGAGCCGAGC GAAGCCCTTG ACCGIGGCAA GGAATGCGAC 

AGGCGGCTAG AACGCGTAGC G 6 TCGGCTCG CTTCGGGAAC TGGCACCGTT CCTTACGCTG 

1210 1220 1230 1240 1250 1260 

GAGCGCCGCG ATGACGCCGA GCGCCGGGAC CTGCGCGAGA TAGAAGAGCA GCATTGCGAC 

CTCGCGGCGC TACTGCGGCT CGCGGCCCTG GACGCGCTCT ATCTTCTCGT CGTAACGCTG 

1270 1280 1290 .1300 1310 1320 

AAGAAGTCCG AAGGCAAGCG CGAAGCOCGT GGCCGCCGGT KCGGCTCGC CAGCCGAGGC 

TTCTTCAGGC 1TCCGTTC6C GCTTCGCG^ CCGGCGGGCA AGGCCGAGCG GTCGGCTCCG 

1330 1340 1350 1^60 1370 1380 

CGCGACGCCG CTGCTGCGCG CCGGCGGAAG CGACGACCAG TGCCAGACCA TGGCGGCGCG 

gcgctgcggc gacgacgcgc Ggccgccttc gctgctggtc acggtctggt accgccgcgc 

1390 1400 1410 1420 1430 1440 

GCTGAGGCAC GCTGCGCCAA GGATCGC^T GGCGGCGCCC AGCGGCGAAA AGAGCGGCAG 

cgactccgtg cgacgcggtt cctagcggta ccgccgcggg tcgccgcttt tctcgccgtc 

1450 1460 1470 1480 1490 1500 

GATCGAGGCG AACGCCGAGA CGCGCAGGCC GAAGQAGAGG ATGAGGGC 6 A CGGCCGCATA 

CTAGCTCCGC TTGCGGCTCT GCGCGTCCGG" CTTCCfCTCC TACTCCCGCT GCCGGCGTAT 

1510 1520 1530 1540 1550 1560 

GGTGCCGATG CGGCTGTCCT TCATGAIPGC AA 6 CGCCGCT TCGCGGTCGC GACCGCCGCC 

CCACGGCTAC GCCGACAGGA AGTACTAGCG ITCGCGGCGA AGCGCCAGCG CTGGCGGCGG 

1570 1580 1590 1600 1610 1620 

AAAGCCATC 6 6 CCGTGTC 6 C CAA 6 CCCGTC TTCGT 6 CAGT GCGCCGGT 6 A CAAGCGCCT 6 

TTTCGGTAGC CGGCACAGCG G^CGGGCAG AAGCACGTCA CGCGGCCACT 6 TTC 6 CGGAC 

1630 1640 16!50 I 66 O 1670 1680 

GATGGCGACG AC6ACAAA6G CGGCAAA^G CGAGCTCACC T6CA6C6CCA T6AG66CCAT 

CTACCGCXGC TGCTGTTTCC GC.CGTTtCtC GCTCGAGTGG ACGTCGCGGT ACTCCCGGTA 

1690 1700 1710 1720 1730 1740 

GGCGACGGCC GCCGATGGCA GTGC6AT€gC CAGGCGGGCG AACG66AAGG CGCGCACGGC 

CCGCTGCCGG CGGCTACCGT CACGCTAKG GTCCGGCGGC TTGCCCTTCC GCGCGTGCCG 

. 1750 1760 1770 1780 1790 1800 

ACGGCTCAAG CGCCC6TCAT AACCTTCGAA AT6ACGC6CA G6CATCGGGA TGCGGCTGAG 

• XGCCGA6TTC GC6GGCA6TA TTGGAA(SG^ IACT<^GCGT CCGTAGCCCT ACGOCGACTC 

* 1810 1820 1630 1840 1850 1860 

AAAGCCGATC 6ACCGCGCCA CATCGTCACA GAAATCGCCA AtGAAGCCCA TGGCTCCTCC 

f TTTCGGCTAG CTGGCGCGGT GTAGCAG^, CTTTAGCGGT TGCTTCGGGT ACCGAGGAGG 

1870 1880 1#0- 1900 1910 1920 

AAGGTTGCGG CCATTGACCC GGCCGClfGCC AAACTCGGCG ACTGCGGCGA GTCTCGCAAG 

TTCCAACGCC GGXAACTGGG CCGGCGAcGG TTTGAGCGGC TGACGCCGCT CAGAGCGTTC 

• •• -.yp. . 

FIGURE 33.1 



FEUILLE DE ffevtPL4CEMENT 




wo 91/11518 



PCT/FR91/00054 



aocctJ??? tagcccSS 

ggcccgcccg cgtgggcgct cccggcgggt gtgaaaaggg tctcgaaagt atccSga 

ss siL° ssE 

sdi sdi sdi ss sdi ss 
gss sis “ ss =1 isH 
si ssi siiss si “ 



2230 

C6CGCTCG6C 

GC6CGAGCCG 

2290 

GGTGGTCAAC 

CCACCAGTTG 



2240 

CGCCTCGA6G 

GCGGAGCTCC 

2300 

CGGCCGCTGG 

6CCGGCGACC 



2250 2260 
AAATCGCCTT CT6GCTC6CC 
TTTAGCGGAA GACCGAGCGG 



zajo 2320 
TGGCGATerr TGCCbCCAAC 
ACCGCiAGAA ACGGCCGTTG 



2270 

6CCTGGAC(» 

CGGACCT6CC 

2330 

CACGGCGTCA 

GTGCCGCAGT 



2280 

GCAAGGCGCC 

CGTTCCGCGG 

2340 

CCCGCCAGGG 

GGGCGGTCCC 



2350 2360 2370 2^ftn ^ ^ _ 

ttcccgtcat ccgtcaccgc acagatggtc gagaattttg ccgccggtgg 

CTGG6GC AAGGGCAGTA GGCAGTGGG6 TGTCTACCAG CTCT3AAAAC GGCGGCCACC 

2410 2420 2430 2440 

AACCAGATCT GCGTCAGCCA CGACCTCGGG CTGAAGGTCT TCGACCTCGC 
GC6ACGCTAG TT6GTCTAGA CGttGTCGGT GCTGGAGCC5 SsJsSS 

2470 2480 2490 2500 

“‘^‘^CGGTG ATATCACC^ GGAAGCCGCG CTGTCCGAGC GCGATTGCGC 
TGAGCTTATG GGCTGGCCAC TATAGTGtet CCTTCGGCGC GACAGGCTCG CGCTAACGCG 

TGGAGG^W TGCCGGCG6C ACGGATCTTC TCTGCATCGS 

gcgctggtac cggaaaccgt ACCTccG<t^ acggccStog iESSSS? 

CGAAATGGa ATCGGC^^ CCACGAT^C GGCCGCGMC AATCTCGGCC Tii i ^ i -^fy 
GCTTTACCCG TAGCCGTTGT GGTGCTAGCG CCGGCGCTAG TTAGAGCCGG AAATACCACC 

CACGGCCGAA GAATGGGTCG 6TCCGKTAC CGGCiadAG GGCGAGG^ TGAAGCG^ 
GTGCCGGCTT CTTACCCAGC CAGGC& SSSS 

2710 2720 21^30 2740 975o <»•»«« 

GATCGCCGCG 6TCGAAAAGG CCGTGGCCCt GCATCGC6AT CACCKiS ? 

COAGCGGCGC CAGCTTTTCC GGCACCGC^ CGtAGC6C» CTGGACAGGC TAGGCGAGCT 

SSSS cgcggccaSg GCTCGCGCCA TCCTGGCCGC 

tgactacgca gcggagccgc cagcactcta gcgccggtj^ cgaccS aSSScg 

2®30 -2840 2650 2860 opto •soba 

tcatcatcga cggciacgtg gcgaccgctg cggcttcm 
ggcgcaggtc ttccatggac agiagtag(^; kcgatg^'cgctg^^ gcSgcta 



FIGURE 33.2 
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2890 2900 2910 
CCTGAAGGCG GCCAACCCGT CGGCCCTCGA 
GGACTTCCGC CGGTTGGGCA GCCGGGft^T 

2950 2960 29l0 
ACCGGGGCAT CT6CGC6CGA TCGA6AAGCT 
T6GCCCC6TA GAC6CGC6CT AGCTCTtCGA 

3010 3020 ^0 
6CGGCTTGGC GAAGGCACGG 6CGCGGGCCT 
CGCCGAACC6 CTTCCGrGCC C6CGCC<SS6A 

3070 3080 3090 
TTGCCACAGC GGCATGGCGA CCTTTGCCCA 
AACGGTGTCG CC6TACCGCT GGAAACGCdT 

3130 3140 3150 
TTCC6GCCGG GCTTTGCAGG AAGGCCG6CC 
AAGGCCGGCC CGAAACGTCC TTCCGGCCGG 

i 

3190 3200 3210 
AAGCTGTCGC GTGCCGGGCC TTGATGGATG 
TTC6ACAGCG CACGGCCCGG AACTACC^C 

3250 3260 3270 
CGCGCCCTAG CTATAGTCTT GGGTGCCTGC 
GCGCGGGATC GATATCAGAA CCCACGGA^CG 

3310 3320 3330 
ACGATGTCGA AGCAAGCACA GTTTCAAGCC 
TGCTACAGCT TCGTTCGTGT CAAAGTTCGG 

3370 3380 3390 
CACGCACCGC ATTGGACAGA CGGGTCCTGT 
GTGCGTGGCG TAACCTGTCT GCCCAGGACA 

3430 3440 3450 
TGCCGCTGCG AGCTATTCGC TCGGCGGGGC 
ACGGCGACGC TCGATAAGCG AGCCGCC^G 

3490 3500 3510 
CCACGAGCTG ATCGCCTTTG CCGCCGCGAT 
GGTGCTCGAC TAGCG6AAAC 66CGGCGCTA 

3550 3560 3570 
CTTCCAATAT GTGGC6AIGG CGATCCT6TT 
GAAGGTTATA CACCGCTACC GCTAGGACAA 

3610 3620 3630 
CACGGCAATC GAGGAAATTG TCGATCGCGT 
6TGCCGTTAG CTCCTTTAAC A6CIAGCGCA 

3670 3680 3690 
C6CCAA6GAT CTCGGCTCCT TCGCCTGCCT 
GCGGTTCCZA 6AGCCGA6GA A6CQG>!^CGGA 

3730 3740 3750 
CGCCTATGTC GTGATCTTCG ACGGCItCAT 
GCGGATACAG CACXAGAAGC TGCCGAAGTA 

3790 3800 3810 
ACCCGATAAA GCACATGCGO ACGCA6CGGG 
TGGGCTATTT CGTGTACGCC TGCGTGGCCC 



FIGURE 



PL. 89//J'! 

2920 2930 2940 
CCATT6CCTG ATCGGCCATG TTTCGGGCGA 
GGTAAC6GAC 7AGCCGGTAC AAAGCCCGCT 

2980 2990 3000 
CGGCAAGACG CCGCTGCTGG CACTCGGCAT 
GCCGTTCTGC GGCGACGACC GTGAGCCGTA 

3040 3050 3060 
TGCCGGCGGT ATCGTCAAGG CGGCGGCCGC 
ACGGCGGCCA TAGCAGT7CC GCCGCCGGCG 

3100 3110 3120 
GGCCGGCGTC AGCAACAAGG AATAGTGAAG 
CCGGCCGCAG TCGTTGTTCC TTATCACTTC 

3160 3170 3180 
GGTTTCTGTC CAAGGCCTGT CACGGGCGCG 
CCAAAGACAG G77CCGGACA G7GCCCGCGC 

3220 3230 3240 
CGTCCTTCTC GCCTATCCAA AGCGCAAATG 
GCAGGAAGAG CGGA7AGGT7 7CGCG7T7AC 

3260 3290 3300 
AACCGAGACC GCC7TGCAT7 CGCCTCAA7C 
77GGC7C7GG CGGAACG7AA GCGGAG77AG 

3340 3350 3360 
C7G7CGAGAC GAAA7GGACG CCAAGAACAC 
GACAGC7C7G C777ACC7GC GG77C77G7G 

3400 3410 3420 
CGAGAAGCAG ACCGGCA77C 6GCA7C7C77 
GC7C77CGTC 7GGCCGTAAG CCGTAGA6AA 

3450 3470 3480 
CAAGCGGCTG A7CGGCGA6G C7GCCT77CG 
G77CGCPGAC 7AGCCGC7CC GACGGAAAGC 

3520^ 3530 3540 
GA7CGCTTTC ATCA7CG7CG GCGCAACC77 
C7AGCGAAAG 7AG1AGCAGC CGCG77GGAA 

3580 3590 3600 
CC7GC7GA7G A766CCT7C6 AG6CGA7CAA 
GGACGAC7AC 7ACCGGAAGC TCCGC7A67T 

3640 3650 3660 
T7C7CCCGAA A7C7CGGAAA 7GG67AAGAA 
AAGAGGGC7T TAGA6CC777 ACCCA77C77 

3700 3710 3720 
C7GCC7GA77 G7CGCCAAC6 G7G7C7A7GC 
GACGGACTAA CAGCGG77GC CACAGATACG 

3760 3770 3780 
GAACTGACCG GCTAGC6GGC C6GCGCCTTC 
C77GACTGGC CGA7CGCCCG GCCGCGGAAG 

3820 3830 3840 
7TGCCCCGGG 67ACCG7GAC G7CG7CGAAA 
AACGGGGGCCi' CAT6GCAC76 CAGCA6C77T 
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PL. 9ol/r7% 

3850 3860 3870 3880 3890 

TCATCAGCC6 GATCC 
AGTA6TC6GC CTAGG 
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KCM - COBS 



PL. 99/14'^/ 
PREMIER BESIDU - 1 

dernier RESIDU « 332 



1 


PHE 


F 


NOMBRE 

15 


% NOMB 
4.52 


2 


LEU 


L 


29 


8.73 


3 


ILE 


1 


20 


6.02 


4 


MET 


M 


7 


2.11 


5 


VRL 


V 


33 


9.94 


6 


SER 


S 


15 


4.52 


7 


PRO 


P 


11 


3.31 


8 


THR 


T 


24 


7.23 


9 


AlA 


A 


32 


9.64 


10 


TYR 


y 


9 


2.71 


11 


* 


* 


0 


0.06 


12 


HIS 


H 


10 . 


3.01 


13 


GLN 


Q 


10 


3.01 


14 


ASN 


N 


12 


3. .61 


15 


LYS 


K 


13 


3.92 


16 


ASP 


D 


28 


8.43 


17 


6LU 


£ 


15 


4; 52 


18 


CYS 


C 


3 


0.90 


19 


TRP 


W 


4 


1.20 


20 


ARC 


R 


22 


6.63 


21 

22 


6LY 


G 


20 


6.02 




* 


0 


OiOO 



POIDS 


% POIDS 


2206.03 


5.97 


3279.44 


8.87 


2261.68 


6.12 


917.28 


2.48 


3269.26 


8.85 


1305.48 


3.53 


1067.58 


2.89 


2425.14 


6.56 


2273.19 


6.15 


1467.57 


3.97 


0.00 


0.00 


1370.59 


3.71 


1280.59 


3.46 


1368.52 


3.70 


1665.23 


4.51 


3220.75 


8.71 


1935.64 


5.24 


309.03 


0.84 


744.32 


2.01 


3434.22 


9.29 


1140.43 


3.09 


0.00 


0.00 



4U.iiJ.OUS 



36960.0000 

36983.1797 



Masse moleculaire (monoisotopique) - 
Masse moleculaire (moyenne) m 

INDEX DE POIARITE {%) « 44 88 

POINT ISOELECTRIQUE = 6*34 

DO 260 (Img/ml) - 0.6II DO 280* (Img/aa) - 0.891 



HVDROPHILICITE 

OE 1 n 332 




33 66 99 132 165 198 231 264 297 330 

FIGURE;i40 
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GENE cobs ET PROTEINE COBS 

SEQUENCE DU FRAGMENT .SAlI-^aXl-Eall-Eall-Sall -Byl l DE 4749 BP, DE 1512 A -2510 



MetMetSerLysIleAspLeuAspIleSerAsnLeuP:roAspThrThrIleSerValArgGluValPheGlyIle 

ATGATGAGCAAGATTGACCTCGACATTTCCAACCTCCCCGACACCACGATTTCCGTCCGGGAGGTTTTCGGTATT 

1521 1531 1541 1551 > 1561 1571 1581 

AspThrAspLeuArgValProAlaTyrSerLysGlyAspAlaTyrValProAspLeuAspProAspTyrLeuPhe 
GATACGGATTTGCGCGTTCCTGCCTATTCGAAGGGCGACrcCTATGTCCCGGATCTGGATCCGGACTACCTCTTC 
1596 1606 1616 1626 1636 1646 1656 

AspArgGluThrThrLeuAlalleiieuAlaGlyPhe^allisAsnArgArg^ValMetValSerGlyTyrHisGly 

GACCGCGAAACGACGCTCGCCATTtTCGCAGGCTTCd&CACAACCGACGCGTGATGGTGTCGGGCTATCACGGC 

1671 1681 1691 1701 1711 1721 1731 

ThrGlyLysSerThrHislleGluGlnValAlaAlaArgLeuAsnT^PrpCysValArgValAsnLeuAspSer 

ACCGGCAAGTCCACCCATATCGAGCAGGTCGCCGCGCGCCTCAACTGGCCGTGCGTGCGCGTCAACCTCGATAGC 

1746 1756 1766 1786 1796 1806 

HxsValSerArglleAspLeuValGlyLysAspAlalleValValLysAspGlyLeuGinValThrGluPheLys 

CATGTCAGCCGTATCGACCTCGTCGGCAAGGACGCGATCGTCGTCAAGGACGGCCTGCAGGTCACCGAATTCAAG 

1821 1831 1841 1,851 1861 1871 1881 

AspGlylleLeuProTrpAlaTyrGlnHisAsnyalAlaLeuValPtf^pGluTyrAspAlaGlyArgProAsp 

GACGGCATCCTGCCCTGGGCCTACCAGCACAAT'GTCGCGCTCGTGTTCGACGAATACGATGCCGGCCGCCCGGAC 

1896 1906 1916 ii26 li:936 1946 • 1956 



GTCATGTTCGTCATCCAGCGCGTGCTGGAATCCTCGGdCCGCCTGACGCTGCTCGACCAGAGCCGTGTCATCCGT 
1971 1981 1991 - 2661 ZOll- 2021 2031 

ProHisProAlaPheArgLeuPheAlaThrAlaAsnThrValGlyLeuGl^AspThrThrGlyLeuTyrHisGly 

CCGCACCCGGCCTTCCGCCTGTTTGCGACCGCCAACAdCGTCGGCCTCGGCGACACGACCGGCCTCTATCACGGC 

2046 2056 2066 i 2,076 .2086 2096 2106 

ThrGlnGlnlleAsnGlnAlaGlnMetA&pArgTirpSerlleVal^hrThrLeuAsnTyrLeuProHisAspLys 

ACGCAGCAGATCAACCAGGCGCAGATGGACCGCTGGTCGATCGTCACCACGCTGAACTACCTGCCGCACGACAAG 

2121 2131 2141 215r 2161 217i: 2181 



GAAGTCGACATCGTCGCCGCCAAGGTCAAGGGCTTCACCGCCGACAAGGGCCGCGAGACCGTCTCCAAGATGGTA 

2196 2206 2216 2226 2236 2246 2256 

ArgValAlaAspLeuThrArgAlaAlaPhelleAsnGlyAspLeuSerThrValMetSerProArgThrVallle 

cgtgtcgccgacctcacgcgcgcagccttcatcaatggcgatctctcgactgtcatgagcccgcgtacggtcatc 

2271 2281 2291 2dpi,,. 2311 2321 2331 

ThrTrpAlaGluAsnAlaHisIlePheGlyAspIleAlaPheAlaPheArgValThrPheLeuAsnLysCysAsp 

acctgggccgagaacgcccacatcttcggcgaCatcgctttcgccttccgcgtgaccttcctcaacaagtgcgac 

2346 2356 2366 ^>>6 2386 2396 2406 

GluLeuGluArgAlaLeuValAlaGluHisTyrGln^rgAlaPheGlylleGluLeuLysGluCysAlaAlaAsn 

GAGCTG6AGCGGGCGCTGGTCGCCGAGCACTACCAGdGCGCCTTCGGCA^PCGAGCTGAAGGAATGCGCTGCCAAC 

2421 2431 2441 2451 2461 2471 2481 

IleValLeuGluAlaThr Ala ^ 

ATCGTGCTCGAAGCCACCGCCTGA 

2496 2506 
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HVDROPHJLICITE 




63 126 189 252 315 378 441 584 567 638 

FIGURE 40.2 





wo 91/11518 



PCT/FR91/00054 



GENE cobT ET PROTEINS COST 

SEQUENCE DU FRAGMENT Eall-Sall-Sall-SalT -Sal l -Byl l DE 4749 BP, DE 2616 A 4511 



ValSerSerAsnSerLysAlaLysProThrThrArgGliiAsnAlaAlaGluProPheLysArgAlaLeuSerGly 

gtgagctcgaattcgaaggcaaagccaaccacgcgcgagaatgctgcggaaccgttcaagcgggcgctttccggc 

2625 2635 2645 2655 2665 2675 2685 

CysIleArgSerlleAlaGlyAspAlaGluValGluVAlAlaPheAlaAsnGluArgProGlyMetThrGlyGlu 

tgcatccgatcgatcgcgggcgatgccgaggtggaagtcgccttcgccaacgagcggccgggcatgaccggcgaa 

2700 2710 2720 2730 2740 2750 2760 

ArglleArgLexiProGluLeuSerLysArgProThrLeuGlhGluLeuAlaValThrArgGlyLeuGlyAspSer 

cgcatccgtctgccggaactttccaagcgcccgaccctgcaggaacttgccgtgacccgcgggctcggtgacagc 

2775 2785 2795 2805 2815 2825 2835 

MetAlaLeuArgLysAlaCysThxHisAlaArglleGlnArgThrMetSerProGlnGlyAlaAspAlaArgAla 

atggcgctgcgcaaggcctgtacgcatgcgcggatccagcgcaccatgtcgccgcaaggggcggacgcccgcgcg 

2850 2860 2870 2880 2890 2900 2910 

IlePheAspAlaValGluGlnAlaArgValGluAlalleGlySerLeuArgMetAlaGlyValAlaLysAsnLeu 

atcttcgatgcggtggagcaggctcgtgtcgaggcgatcgggtcgttgcgcatggcgggtgtcgccaagaacctc 

2925 2935 2945 i955 2965 2975 2985 

AsnValMetLeuGluGluLysTyrAlaLysAlaAsnPl^eAlaThrlleGlxiArgGlnAlaAspAlaProLeuGly 

AACGTCATGCTCGAAGAGAAATACGCCAAGGCGAATTTfcGCAACGATCGAGCGCCAGGCGGACGCGCCGCTCGGC 

3000 3010 3020 3030 3040 3050 3060 

GluAlaValAlaLeuLeuValArgGluLysLeuThrGlyGlnLysProProAlaSerAlaGlyLysValLeuAsp 

GAGGCCGTAGCGCTGCTGGTGCGCGAGAAGCTGACGGGCCAGAAGCCGCCGGCGTCTGCCGGCAAGGTGCTCGAC 

3075 3085 3095 3105 3115 3125 3135 

LeuTrpArgGluPhelleGluGlyLysAlaAlaGlyAsplleGluHisLeuSerSerThrlleAsnAsnGlnGln 
CTCTGGCGCGAGTTCATCGAGGGCAAGGCTGCCGGCGACATTGAGCACCTGTCGTCGACGATCAACAACCAGCAG 

3150 3160 3170 3iS0 3190 3200 3210 

AlaPheAlaArgValValArgAspMetLeuThrSerMetGluValAlaGluLysTyrGlyAspAspAspAsnGlu 

GCCTTTGCCCGGGTCGTTCGCGACATGCTGACCTCGATGGAAGTCGCCGAGAAATACGGTGACGACGACAACGAG 

3225 3235 3245 3255 3265 3275 3285 

ProAspGluGlnGluSerGluThrAspGluAspGlnProArgSetGlnGluGlnAspGluAsnAlaSerAspGlu 
CCGGACGAGCAGGAAAGCGAGACCGACGAAGACCAGCCGCGCAGdCAGGAGCAGGACGAGAACGCCAGCGACGAG 
3300 3310 3320 3330 3340 3350 3360 

GluAlaGlyAspAspAlaAlaProAlaAspGluAsnGInAlaAlaGluGluGlnMetGluGluGlyGluMetAsp 

GAAGCCGGCGACGATGCCGCACCCGCCGACGAGAACCAGGCTGCCGAAG^GCAGATGGAAGAAGGCGAGATGGAC 

3375 3385 3395 3405 3415 3425 3435 

GlyAlaGluIleSerAspAspAspLeuGlnAspGluGlyAspGluAspSerGluThrProGlyGluValLysArg 
GGCGCGGAGATCTCCGACGACGATCTCCAGGACGAAGGCGACGAGGACAGCGAAACGCCCGGCGAGGTCAAGCGT 
3450 3460 3470 3480 3490 3500 3510 

ProAsnGlnProPheAlaAspPheAsnGluLysValAspTyrAlaValPheThrArgGluPheAspGluThrlle 
CCGAACCAGCCCTTCGCCGACTTCAACGAGAAGGTC6ACTACGCCGTCTTCACCCGCGAGTTCGACGAGACGATT 
3525 3535 3545 3555 3565' 3575 3585 

AlaSerGluGluLeuCysAspGluAlaGluLexiAspArgLeuArgAlaPheLeuAspLysGlnLeuAlaHisLeu 

gcctcggaagagctttgcgacgaggccgagctcgaccggctgcgcgccttgctcgacaagcagcttgcccatctt 

3600 3610 3620; ■3630 ‘ '3640 3650 3660 

GlnGlyAlaValGlyArgLe\iAlaAsnArgLeuGln]^gArgLeuMetAlaGlnGlnAsnArgSerTrpGluPhe 

caaggcgcggtcggccgccttgccaaccggctgcagcgccgcctgatggcgcagcagaaccgctcctgggagttc 

3675 3685 3695 l'?05 3715 3725 3735 

AspLeuGluGluGlyTyrLeuAspSerAlaArgLeuGipArgllellelleAspProMetGlnProLeuSerPhe 

gatctcgaagaggggtatctcgattcggcgcggcttcaGcgcatcatcatcgatccgatgcagccgctttccttc 

3750 3760 3770 3fe0 3790 3800 3810 

LysArgGluLysAspThrAsnPheArgAapThrValValThrLeuLeuIleAspAsnSerGlySerMetArgGly 
AAGCGCGAAAAGGACACCAACTTCCGCGATACCGTCGPJGACGCTGCTGATCGACAATTCCGGCTCGATGCGCGGC 
3825 3835 3845 3655 3865 3875 3885 

ArgProIleThrValAlaAlaThrCysAlaAsplleLeiiAlaArgThrLeuGluArgCysGlyValLysValGlu 

cgtccgatcacggttgccgccacctgcgccgatatcctggcgcgcacgctcgagcgctgcggcgtcaaggtcgag 

3900 3910 3920 3|30 .3940 3950 3960 

IleLeuGlyPheThrThrLysAlaTrpLysGlyGlyGlnSerArgGluLysTrpLeuAlaGlyGlyLysProGln 
ATCCTCGGTTTTACCACCAAGGCGTGGAAGGGTGGG^GTCACGCGAGi^GTGGCTGGCCGGCGGCAAGCCACAG 
3975 3985 3995 '4005 40l5 4025 4035 



FIGURE 40.3 
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AlaProGlyArgLeuAsnAspLeuArgHisIleValTyrLysSefcAlaAspAlaProTrpArgArgAlaArgArg 

GCCCCGGGTCGCCTCAACGACCTGCGACACATCGTCTAeAAGTCTGCfcGACGCTCCGTGGCGCCGGGCACGACGC 

4050 4060 4070 4080 «90, 4100 4110 

AsnLeuGlyLeuMetMetArgGluGlyLeuLeuLysGluAsnlleAspGlj^luAlaLeuIleTrpAlaHisGlu 

AATCTCGGCCTGATGATGCGGGAAGGCCTGCTCAAGG^AAACATCGACGGCGAGGCGTTGATTTGGGCGCATGAG 

4125 4135 4145 4155 4165 4175 4185 

ArgLeuMetAlaArgArgGluGlnArgArglleLeuMetMetlleSerAspGlyAlaProValAspAspSerThr 

cggctgatggcgcggcgcgaacagcggcgcatcctgatgatgatttcggacggcgcgccggtcgacgactcgacg 

4200 4210 4220 4230 4240 4250: 4260 

LeuSerValAsnProGlyAsnTyrLeuGluArgHisLeuArgAlaVallleGluGlnlleGluThrArgSerPro 

ctgtcggtcaatccaggaaactatctggagcgtcacctgcgcgcggtcatcgagcagatcgawvcgcgctcgccg 

4275 4285 4295 4305 4315 4325' 4335 

ValGluLeuLeuAlalleGlylleGlyHisAspValThrArgTyrTyrArgArgAlaValThrlleValAspAla 

GTGGAACTGCTGGCGATCGGTATCGGCCACGACGTGACGCGCTACTATCGCCGTGCCGTCACCATCGTCGATGCC 

4350 4360 4370 4380 4390' 4400 4410 

AapGluLeuAlaGlyAlaMetThrGluGlnLeuAlaAlaLeuPheGluAspGluSerGlnArgArgGlySerSer 

gatgagcttgccggcgcgatgaccgaacagctggcc<^ctcttcgaIg!acgaaagccagcgccgcggttcttcg 

4425 4435 4445 4455 4465 4475 4485 

ArgLeuArgArgAl aGly* * * 

CGTCTTCGCCGCGCCGGGTGA 
4500 4510 



figure: 40.4 




wo 91/11518 



PCT/FR91/00054 



PL. 10 4f(Tl 



NOM 


« COBX 




PREMIER RESIDU 


- 1 










DERNIER RESIDU 


- 93 










NOMBRE 


t NOMB 


POIDS % 


POIDS 


1 


PHE 


r- 


3 


3.23 


441.21 


4.29 


2 


LEU 


L 


8 


8.60 


904.67 


8.80 


3 


HE 


I 


5 


5.38 


565.42 


5.50 


4 


MET 


M 


3 


3.23 


393.12 


3.82 


5 


VAL 


V 


5 


5.38 


495.34 


4.82 


6 


SER 


s 


6 


6.45 


522.19 


5.08 


7 


PRO 


P 


6 


6.45 


582.32 


5.66 


8 


THR 


T 


5 


5.38 


505.24 


4.92 


9 


AIA 


A 


10 


10.75 


710.37 


6.91 


10 


TTR 


Y 


0 


0.00 


0.00 


o.Oo 


11 


* 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


B 


7 


7.53 


959.41 


9.33 


13 


GLK 


Q 


2 


2.15 


256.12 


2.49 


14 


ASN 


N 


2 


2.15 


228.09 


2.22 


15 


LYS 


K 


3 


3.23 


384.28 


3.74 


16 


ASP 


D 


3 


3.23 


345.08 


3.36 


17 


GLU 


E 


10 


10.75 


1290.43 


12.55 


18 


CYS 


C 


0 


0.00 


0.00 


0.00 


19 


TRP 


K 


1 


1.08 


186.08 


1.81 


20 


ARG 


R 


7 


7.53 


1092.71 


10.63 


21 


GLY 


G 


7 


7.53 


399.15 


3. 88 


22 


**■ 




0 


0.00 


0.00 


0.00 




RESIDUS 




m 


93 






Hasse moleculaire (monoisotwicrue) * 10279.2354 




Masse moleculaire (moyenne) 


- 10285.6309 




INDEX 


D£ 


POLARITE (%) 


* 


46.39 






POINT 


ISOELECTRIQUE 




6.94 






DO 260 


(Img/ml) » 0. 


411 DO 280 (Img/ml) « 


0.541 



HVOROPHILICITE 
SQBX OE 1 A 03 

• « 

1 . 

0. 

e. 

- 1 . 

-1 . 

0 18 27 36 45 54 63 72 81 98 

FIGURE 4Q. 5 
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(^NB fiobx BT PROTEINS COBX 






SEQUENCE DO FRAGMENT BoclI-Sall-Sall -Sall -Sall -Sall DE 4749 BP, DE 4089 A 4370 



MetSerLeuThrGluThrlleGluLysLysLeuIleGluAlaPheHisProGluArgLeuGluVallleAsnGlu 
ATGTCGCTCACCGAGACCATCGAAAAGAAGCTGATCGiGGCCTTCCACCCTGAACGGCTCGAGGTCATCAACGAG 
4098 4108 4118 4128 4138 4148 4158 

SerHisGlnHisThrGlyHisGlnProGlyPheAspGlyThrGlyQluSerHisMetArgValArglleValSer 

AGCCATCAGCATACCGGCCATCAGCCGGGGTTCGATGGTAbCGGCGAdTCCCACATGCGGGTGCGTATCGTTTCT 

4173 4183 4193 4213 4213 4223 4233 

SerAlaPheAlaGlyMetSerArgValAlaArgHisAir^AialleJVsnAspIieuLeuLysProGluIjeuAspAla 

AGCGCCTTTGCCGGCATGAGCCGTGTCGCCCGCCAO^GCCATCAATGATCTCCTGAAGCCAGAACTCGACGCC 

4248 4258 4268 4278 4288; 4398 4308 

GlyLeuHisAlaLeviAlaValGluProAlaAlaProGlyGluProThrAxgTrp** 
GGCCTGCATGCGCTCGCCGTCGAGCCGGCAGCCCCCG^GAGCCGACCCGCTGGTAG 
4323 4333 4343 4353 4363 



figure' '40.6 
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PL. 


i 06 (lS] 


NCM 


« COBU 




PREMIER RESIDU 


- 1 








DERNIER RESIDU 


« 338 . 










NC»1BRE 


% N04B 


POIDS 


% POIDS 


1 


PHE 


F 


9 


2.66 


1323.62 


3.82 


2 


LEU 


L 


36 


10.65 


4071.03 


11.75 


3 


ILE 


I 


19 


5.62 


2148.60 


6.20 


4 


MET 


M 


9 


2.66 


1179.36 


3.40 


5 


VAL 


V 


21 


6.21 


2080.44 


6.00 


6 


SER 


S 


13 


3.85 


1131.42 


3.26 


7 


PRO 


P 


16 


4.73 


1552.84 


4.48 


8 


THR 


T 


17 


5.03 


1717.81 


4.96 


9 


AZA 


A 


• 61 


18.05 


4333.26 


12.50 


10 


T5fR 


Y 


3 


0.89 


489.19 


1.41 


11 


« 


if 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


e 


2.37 


1096.47 


3.16 


13 


GLN 


Q 


6 


1.78 


768.35 


2.22 


14 


ASN 


K 


9 


2.66 


1026.39 


2.96 


15 


LYS 


K 


12 


3.55 


1537.14 


4.43 


16 


ASP 


D 


13 


3.85 


1495.35 


4.31 


17 


GIU 


£ 


22 


6.51 


2838.94 


8.19 


IS 


CYS 


C 


5 


1.48 


515.05 


1.49 


19 


TRP 


w 


3 


0.89 


558.24 


1.61 


20 


ARG 


R 


16 


4.73 


2497.62 


7.21 


21 


GLY 


G 


40 


11.83 


2280.86 


6.58 


22 


* 




0 


0.00 


0.00 


0.00 




RESIDUE 




* 33B 






Masse moleculaire (nonolsotopique) > 34659.9844 




Masse moleculaire (moyenne) 


« 34681.9609 




IKDEX D£ 


POIARITE (%) 


e 


34.32 






POINT ISOELECTRIQUE 




6.21 






DO 260 


(Img/ml) « 0. 


416 DO 280 (Img/ml) 


- 0.584 



HVDROPHILICITE 

2 . 

1 . 

e. 

-c. 

-1 . 

- 2 . 

33 66 99 132 165 198 231 264 297 338 

FIGURE 41 

FEUILLE pfe RpMf lApEMENT 
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GENE eobO ET PROTEINS COBU 

SEQUENCE DU FRAGMENT Sstl -Sst l -BamH I DE 3855 BPj DE 2099 A 3115 






2108 



2118 



2128 



2148 ; 



2158 



2168 



ctcgttgccgcgcgggagcgggacgcccagctgacG^gccgccgggcgcgctcggccgcctcgaggaaatcgcc 

2183 2193 2203 2^13 2223 2233 



2243 






22983 



®^®’’'^^^^^°^^®^°’’®^'^'^ccgttcccgtcatcCgtcaccGcacagatggtcgagaattttgccgccggt 

2333 2343 2353 > 23^63 ■ 2373 



2308 

IGluJ 

CGAGI 

2383 



2318 



2393 



rPro 



2408 



2418 



, 2428 ■; 2_4S8 2448 2458 2468 

2483 



2493 



^503 



2513 



2523 



2533 



2543 



2558 



2568 2576 2388 2598 2608 2618 

LeuGlyLeuTyrGlyGlyThrAlaGluGluTBpValG%ProGlyThrGlySetGluGlyGluValLeuLvsAro 

ctcggcctttatggtggcacggccgaagaatgggtcg®ccgggtaccggctccgagggcgasgtgctgaagcgc 

2633 2643 2653 .2663 2673 2683 ' 2693 



2708 



2718 



2728 Z738: 2748 : 2758 2768 

CTCGGCGGTCGTGAGATCGCGGCCATGGCTGGCGCCA^5lGGCC|fCbCGCGTCCAGAAGGTACCTGTCATCATC 

2783 2793 2803 2813 2823 2833 2843 



2858 



2868 



2878 2:688 2898 2908 2918 

GGCCATGTTTCGGGCGAACCGGGGCATCTGCGCGCGJ^GGAGAAGCTCGGCAAGACGCCGCTGCTGGCACTCGGC 

2933 2943 2955 2&<!5 2973 2983 2993 



3008 3018 3028 

MetAlaThrPheAlaGlnAlaGlyValSerAsnLysGiia*** 

atggcgacctttgcccaggccggcgtcagcaacaaggaatag 

3083 3093 3103 3113 



3048 



3058 



3068 



FIGURE 41.2 
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NOM « COBV 



PREMIER RESlOU 
DERNIER RESIDU 



PL. 

1 

302 



108 1 ir/ 



1 


PHE 


F 


NCMBRE 

18 


% NC^ 
5.96 


2 


LEU 


L 


39 


12.91 


3 


HE 


I 


13 


4.30 


4 


MET 


H 


10 


3.31 


5 


VAL 


V 


23 


7.62 


6 


SER 


S 


18 


5.9:6 


7 


PRO 


P 


12 


3.97 


8 


THR 


T 


10 


3.31 


9 


ALA 


A 


63 


20.86 


10 


T3fR 


Y 


3 


0.99 


11 


* 


* 


0 


0.00 


12 


HIS 


H ‘ 


3 


0^99 


13 


GLN 


Q 


6 


1.99 


14 


ASN 


N 


2 


0 . 6 ^ 

1.66 


IS 


LYS 


K 


S 


16 


ASP 


D 


10 


3.3L 


17 


GLU 


£ 


7 


2/32 


18 


CYS 


C 


3 


0.99: 


19 


TRP 


W 


2 


0.66 


20 


ARG 


R 


19 


6.29 


21 


GLY 


6 


36 


11.92.: 


22 






0 


0.00 



POIDS 


% POIDS 


2647.23 


8.64 


4410.26 


14.39 


1470.09 


4.80 


1310.41 


4.28 


2278.57 


7.44 


1566.58 


5.11 


1164.63 


3.80 


1010.48 


3.30 


4475.34 


14.61 


489.19 


1.60 


0.00 


0.00 


411.18 


1.34 


768.35 


2.51 


228.09 


0.74 


640.47 


2.09 


1150.27 


3.75 


903.30 


2.95 


309.03 


1.01 


372.16 


1.21 


2965.92 


9.68 


2052.77 


6.70 


0.00 


0.00 



RESIDUE 



302 



Masse moleculaire (monoisotopicnje) ■ 
Masse moleculaire (moyenne) « 

INDEX DE POIARITE (%) « 26 ‘49 

POINT ISOELECTRIQUE « ■ 997 

DO 260 (Img/ml) - 0.391 DO 280* (Img/ml) 



30642.3359 

30662.0820 



0.479 



HVOROPHILICITE 




FIGURE 41. > 



rpi.iii 
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GENE cobV BT PROTEINS COBV 

SEQUENCE DU FRAGMENT BamH I -Sst l-Saf T dE 3855 BP, DE 1885 A 2793 






MetLysGlyLeuGlyLysValCysAlaAlaLeuAlaGLyAlaProAlaArgLeuAlaArgLeuAlaAlaValGly 

ATGAAAGGTCTGGGAAAAGTGTGCGCGGCCCTCGCGGGiGCGCCCGCCCGGCTTGCGAGACTCGCCGCAGTCGGC 

1894 1904 1914 1924 1934 1944 1954 

GluPheGlySerGlyArgValAsnGlyArgAsnLeuGlyGlyAlaMetGlyPheValGlyAspPheCysAspAsp 

gagtttggcagcggccgggtcaatggccgcaaccttggaggagccatgggcttcgtTggcgatttctgtgacgat 

1969 1979 1989 1999 2009 2019 2029 

ValAlaArgSerlleGlyPheLeuSerArglleProMetProAlaArgHisPheGluGlyTyrAspGlyArgLeu 
GTGGCGCGGTCGATCGGCTTTCTCAGCCGCATCCCGATGCCTGCGCGTCATTTCGAAGGTTATGACGGGCGCTTG 
2044 2054 2064 i074 2084 2094 2104 

SerArgAlaValArgAlaPheProPheAlaGlyLeuAIall^laLeuProSerAlaAlaValAlaMetAlaLeu 

AGCCGTGCCGTGCGCGCCTTCCCGTTCGCCGGCCTGGCGATCGCACTGCCATCGGCGGCCGTCGCCATGGCCCTC 

2119 2129 2139 2l49 2159, 2169 2179 

MetAlaLeuGlnValSerSerLeuPheAlaAlaPheValValValAialleGlnAlaLeuValThrGlyAlaLeu 

atggcgctgcaggtgagctcgctctttgccgcctttgtCgtcgtcgccatccaggcgcttgtcaccggcgcactg 

2194 2204 2214 2224 2234 2244 2254 

HxsGluAspGlyLeuGlyAspThrAlaAspGlyPheGlyGlyGlyArgAspArgGluAlaAlaLeuAlalleMet 

cacgaagacgggcttggcgacacggccgatggctttggcgggggtcgcgagcgcgaagcggcgcttgcgatcatg 

2269 2279 2289 2299 2309 2319 2329 

LysAspSerArglleGlyThrTyrAlaAlaValAlaieiilleLeuSerPheGlyLeuArgValSerAlaPheAla 

aaggacagccgcatcggcacctatgcggccgtcgccctcatcctctccttcggcctgcgcgtctcggcgttcgcc 

2344 2354 2364 ,2374 ; 2384 2394 2404 

SerlleLeuProLeuPheSerProLeuGlyAlaAliifietAlalleLeuGlyAlaAlaCysLeuSerArgAlaAla 
TCGATCCTGCCGCTCTTTTCGCCGCTGGGCGCCGCCltfGGCGATCGTTGGCGCAGCGTGCCTCAGCCGCGCCGCC 
2419 2429 2439 2449 2459 2469 2479 

MetValTrpHisTrpSerSerLeuProProAlaArgSairSerGlyValAlaAlaSerAlaGlyGluProGluPro 
ATGGTCTGGCACTGGTCGTCGCTTCCGCCGGCGCGCAGCAGCGGCGTCGCSGCCTCGGCTGGCGAGCCGGAACCG 
2494 2504 2514 2524 2534 2544 2554 

AlaAlaThrArgPheAlaLeioAlaPheGlyLeuLeuVaiAiaiMetlieuLeuPheTyrLeuAlaGlnValProAla 

GCGGCCACGCGCTTCGCGCTTGCCTTCGGACTTCTTG^CGCAATGCTGCTCTTCTATCTCGCGCAGGTCCCGGCG 

2569 2579 2589 2599 2609 2619 2629 

LeuGlyVallleAlaAlaLeuValAlaPheLeuAlaThrValLysGlyPheAlaArgLeuAlaMetArgLyslle 

ctcggcgtcatcgcggcgctcgtcgcattccttgccacggtcaagggcttcgctcggctggcgatgcgcaagatc 

2644 2654 2664 2674 ‘2684 2694 2704 

GlyGlyGlnThrGlyAspThxIleGlyAlaThrGlnGlnLeuThrGluIljaAlaValleuGlyAlaLeuAlaLeu 

ggcggacaaacgggcgacacgatcggggcgacgcagcaactgaccgaaatcgccgtgctcggtgcccttgcgctg 

2719 2729 2739 2749 2759 2769 2779 

ThrVal*** 

ACGGTTTGA 



FIGURE 41.4 
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PL. Ill/ IX f 



Sequence Longueur ■ 13144 de la 13144 



10 20 30 - 40 50 €0 
GAGCTCGAA6 GGGCTTCCGC CCCGATCGCT GGC6TTAGCC GACGITCGAC GTGCGGATGA 
CTCGAGCTTC CCCGAASGCG GSGCIAGd^ CCGCAATCG6 CTGCAAGCT6 CACGCCTACT 

70 80 , .90 ‘ 100 no 120 
CGCCGAGCGG GCCGAAGGGC (^GTCGACGA CGaGGTTGCG TACGCGCGAC TGGCTGGACG 

gcggctcgcc cggcttcccg c6cagctgct gctcc^cgc atgcgcgctg accgacctgc 

130 140 150 160 170 IBO 
GAACCTTCGA GTTCCAGGCG ATCTGAACGA AATTGGGCTT GCTGAAAATA TACAGCATGG 
CTTGGAAGCT CAAGGTCCGfi tSSt^TTGCT TXAACCCGAA CGACTTTTAT ATGTCGTACC 

190 200 210 220 230 240 
ACATGAACCT TGAGAGGCCG GAGGCCTATC CTCCGGGGCG TGTTGCXATG CCGCTGATAT 
TGTACTTGGA ACTCTCCGGC CnXGGATAGvGAGGCCCCGC ACAACGAIAC GGCGACTAIA 

250 260 ! 270 280 290 300 
AGGTGTGCGC TGC AAAAAAT OSSAATGCCAA ACTCGCCACG CCATGTCGCA TTCTGGCTAT 
TCCACACGCG ACGTTTTTTA ACTTACGGTT l^GCGGTGC GGTACAGCGT AAGACCGATA 

310 ^ 320 330 340 350 360 
CGGCCGCGAC ATTTTCSACA AGCCTTGCGA AAGCGCGAAA CAATGC6TGA AAGGGCTTTG 
GCCGGCGCT6 TAAAAGCTGT TgGGAACGCT nCGCGCITT GTTACGCACT TTCCCGAAAC 

370 380 390 400 410 420 
TCAATTGCGG CGAAATCGTG TQGAAACAGA CCTTTGCCGC TGCCCGTTTC AGTGTTACCG 
AGTTAACGCC GCTTrAGCAC ASCTTIGTCT GGAAACGGCG ACGGGCAAAG TCACAATGGC 

430 ^ 440 . 450 460 470 480 
ATGGCCGCAT GACACGCAGG ATCATGTTGC AGGGAACCGG CTCGGAT6TC GGAAAATCGG 
TACCGGCGXA CTGTGCGTCC ^{AGTACAACG TCCCtTGGCC GAGCCTACAG CCTTTTAGCC 

490 500 510 520 530 540 
TATTGGTGGC GGGGCTCTGC CGGCTTGCC6 CCAATCAGGG CCTGAAGGTC CGGCCGTTCA 
ATAACCACCG CCCCGAGAC6 GCOGAACGGC GGTTAGXCCC GGACITCCAG GCCG6CAA6T 

550 560 570 580 590 600 
AGCCGCAGAA CATGTCGAAC AACGCCGCCG TTTQCCACGA CGGCGGCGAG ATCGGCCGCG 
TCGGCGTCTT GTACAGCTTG TIGCGGCGGC AAAGGCTGCT GCCGCCGCTC TAGCCGGCGC 

610 620 ' 630 640 650 660 
CGCAATGGCT GCAGGCGCT6 GGCGCGCGCG TGCCGTCGTC G6TGCACATG AACCCGGTGC 
GCGTTACO^ C6TCCGCGAC CGGCGCGCGC ACGGCAGCA6 CCAC6TGTAC TTG6GCCACG 

670 680 ■ 690 700 710 720 
TCCTGAAGCC GCAGTCGGAC GTGGGCAGCC AGATCGTCGT TCAGGGCAAG GTCGCCGGGC 
AGGACTTCGG CGTCAGCCTG CACCCGTCGG TCTAGCAGCA AGTCCCGTTC CAGCGGCCCG 

730 740 750 760 770 780 
AGGCCAGGGG GCGGGAATAT CAGGCGCTCA AGCCCAAGCT GCTGGGCGCC GTCATGGAGA 
TCCGGTCCCC CGCCCTIATA GTCCGCGAGT TCGGGITCGA CGACCCGCGG CAGTACCTCT 

790 800 v ’r 810 820 830 840 
GTTTCGAACA AATATCGGCC GOTGCCGATC TC6T66TG6T CGAAGGC6CC GGCTCGCCGG 
CAAAGCTTGT TIAXAGCCG6 CCACGGCTA6 AGCACCACCA GCTTCCGCGG CCGAGCGGCC 

850 860 870 880 890 900 
CCGAAATCAA CCTCAG6CCC GGCGACATCG CCAAIATGGG CTTTGCGACA CGGGCCAATG 
GGCTTTA6TT GGAGTCO^ CCGCTGTAGC GGTIATACCC GAAACGCT6T GCCC6GTTAC 

910 . r; 920 930 940 950 960 
FIGURE 43 
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PL. nzjlS} 

TGCCGGTCGT GCTGGTCGGC GACATCGACC GCGGGGGGGT GATCGCCTCG CTGGTCGGCA 
ACGGCCAGCA CGACCAGCCG CTGTAGCTGG CGCCCCCCCA CTAGCGGAGC GACCAGCCGT 

970 980 990 1000 1010 1020 

CGCATGCGAT CCTGCCCGAG 6AAGACCGGC 6CATGGTGAC CGGCXATCTC ATCAACAAGT 
GCGTACGCTA GGACGGGCTC CTTCTGGCCG CGTACCACTG GCCGATAGAG lAGTTGTTCA 

‘ 1030 1040 , 1050 1060 1070 1080 

TCCGCGGCGA CGTCACGCTG TTCGACGACG GCATTGCTGC CGTCRACCGC TACACCGGCT 

* AGGCGCCGCT GCAGTGCGAC AAGCTGCTGC CGTAACGACG GOIGTIGGCG ATGTGGCCGA 

1090 1100. 1110 1120 1130 1140 

GGCCCTGCTT CGGCGTCGTG CCGTGGCTGA AGGCGGCGGC ACGCCTGCCG GCGGAA6ATT 
CCGGGACGAA GCCGCAGCAC GGCACCGACT TCCGCCGCCG TGCGGACGGC CGCCTTCTAA 

1150 1160 1170 1180 1190 1200 

CCGTCGTGCT GGAGAAGCTG ACGCGCGGCG AGGGGCGGGC GCTGAAGGTT GCCGTCCCGG 
GGCAGCACGA CCTCTTCGAC T^CGCGCOSC TCCCCGCCCG CGACTTCCAA CGGCAGGGCC 

1210 1220 1230 1240 1250 1260 

TACTGTCGCG CATCGCCAAT TTCGACGACG TCGATCCGCT CGCCGCCGAA CCGGAGATTG 
ATGACAGCGC GTAGCGGTTA AAGCTGCTGC AGCOAGGCGA GCGGCGGCTT GGCCTCTAAC 

1270 1280 1290 1300 1310 1320 

ATCTCGTCTT C6TGCGGCCT GGCAGTCCCA TTCCGGTCGA CGCTGGCCTC GTCGTCATTC 
TAGAGCAGAA GCACGCCGGA CCGTCAGGGT AAGGCCAGCT GCGACCGGAG CAGCAGTAAG 

1330 1340 1350 1360 1370 1380 

CCGGGTCGAA ATCGACCATC GGCGACCTCA TCGATTTCCG TGCGCAAGGG TGGGACCGTG 
GGCCCAGCTT TAGCTGGTAG CCGCTGGAGT AGCIAAAGGC ACGCGTTCCC ACCCTGGCAC 

1390 1400 1410 1420 1430 1440 

ACCTCGAACG TCATGTGCGC CGGGGCGGCC GGGTCATCGG CATCTGCGGC GGCTACCAGA 
TGGAGCTTGC AGTACACGCG GCCCCGCCGG CCCAGTAGCC GTAGACGCCG CCGATGGTCT 

1450 1460 1470 1480 1490 1500 

TGCTCGGCCG GCGCGTCACC 6ATCCGCTCG GCATCGAGGG CGGCGAACGT GCGGTCGAGG 
ACGAGCCGGC CGCGCAGTGG CTAGGCGAGC CGTAGCTCCC GCCGCTTGCA CGCCAGCTCC 

1510 1520 1530 1540 1550 1560 

GCCTCGGGCT GCTCGAGGTC SAGACCGAGA TGGCGCCGGA AAAGACGGTG CGCAACAGCC 
CG6AGCCCGA C6AGCTCCAG CTCTGGCTCT ACCGCGGCCT TTTCTGCCAC GCGTTGTCGG 

1570 1580 1590 1600 1610 1620 

GCGCCTGGTC GCTGGAGCAT GATGTGGTGC TCGAAGGCIA COIAATCCAT CTTGGCAAGA 

cgcggaccag cgacctcgta ctacaccacg agcttccgat gctti a ggta gaaccgttct 
1630 1640 1650 1660 1670 1680 

cgcaaggtgc ggactgtggc cggccgtcgg tgcgcatcga caatcgcgcc gacggcgccc 

GCGTTCCACG CCTGACACCG &CGGCAGCC ACGCGTAGCT GTTAGCGCGG CTGCCGCGGG 

1690 1700 1710 1720 1730 1740 

TTTCGGCCGA TGGCCGCGTG ATGGGCACCT ACCTGCATGG GCTCTTCACC AGCGACGCCT 
^ AAAGCCGGCT ACCGGCGCAC TACCCGTGGA TGGACGTACC C6AGAAGTGG TCGCTGCGSl 

* 1750 1760 1770 1780 1790 1800 

ATCGC6GCGC GCTGCTCAAG AGTTTCGGCA TCGAAGGCGG CGCCAACAAC TACCGCCAAT 
TAGCGCOGCG CGACGAGTTC fCAAAGCCGT AGCTTCCGCC GCGGITCTTG ATGGOGGTTA 

■ 1810 1820 1830 1840 1850 1860 

CG6TCGATGC G6CGCTCGAC ^TGTCGCGA AC6AACTGGA GGCTGTGCTC 6ATCGTCGCT 
GCCAGCTACG CCGCGAGCTG ^ACAGCGCT TGCTTGACCT CCGACACGAG CTAGCAGCGA 

1870 1880^ 1890 1900 1910 1920 

GGCTGGACGA GTTGCTCAGG CACEAGGGAC GCGGCAACGG TCAGCCAGCA GGTCCGGTAC 
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CCGACCTGCT CAACGAGTCC GTSftTCCCTG CGCCGTTGCC A6TCG6TC6T CCAGGCCATG 

1930 1940, 1950 1960 1970 1980 

GTCGGGCCCA ACAGGftGCAA ©BAGCTTATC CGACGGAACT ACGCTGCGAC ATCGTGCTCC 

CAGCCCGGGT TGTCCTCGTT GCTCGAATAG GCTGCCTTGA TGCGACGCTG TAGCACGAGG 

1990 2000 ' 2010 2020 2030 2040 

• TCGCTTGCGG CTTCCCAGAC TTCCCGCGCG GCATCCAGGT TCATCAGGGC AATCOXAGG 

AGC6AACGCC GAAGGGTCTG^AAGOGCGCGC CGTAGGTCCA AGTAGTCCCG TTAGGGGTCC 

2050 2060 2070 2080 2090 2100 

CCGACGATCA GGTCCG6CCA GGCCGACTGC CACAGATAG6 CTGTCGCCA6 ACCCGCGGCG 

GGCTGCZAGr CCAGGCCGGT CGGGCTGACG (^GltTATCC GACAGCGGTC TGGGCGCCGC 

» ■ 

2110 2120 2130 2140 2150 2160 

ATGATGGCCA CATTGSCGAA GGCATCGTTG CGGGCCGA6A GAAATGCTGC CCGCGTGAGC 

TACTACCGGT GTAACCSgCTT CCG?AGCAAC GCCCGGCTCT CTTTAC6ACG GGCGCACTCG 

2170 2180 2190 2200 2210 2220 

GTGCCGCTCG TGTGACG6TA G6CGACGAGC AGATAGGCGC AGAAGAGGTT 6ACCACCAGC 

CACGGCGAGC ACACTGCCAT CCGCTGCTCG TCTATCCGCG TCTTCTCCAA CTG6TGGTCG 

2230 2240 2250 2260 2270 2280 

6CCCCAA6TC CGGTCAGGGA CAGGGCAAAG GGCTCfGGCG GGACCGGATC CATGAACTTC 

CGGGGTTCAG GCCACTCCCI GfCCCGTTTC CCGA^CCGC CCTG6CCTAG GTACTTGAAG 

2290 2300 2310 2320 2330 2340 

GCCCAGGCCG TCCAAAGGAA GGCCAGCGO: feSTACCAGTA GAATGAACGC CATCGCCATG 
CGGGTCCGGC AGGITICCTT CGGGTCGCGG CCAtGGTCAT CKTACTTGCG GTAGCGGTAC 

2350 2360.: 2370 2380 2390 2400 

CCGACCCGCG CGCGGGTTCG C6CCGTCCAG GCCAGAGCAA AGAAAATCAG CATGTTGACG 

ggctgggcgc gcgcccaagc gcggcaggtc cggtctcgtt tcttttagtc gtacaactgc 

2410 2420 2430 2440 2450 2460 

6AGGC6TCTT CGAGGAAGl^ GACGCTGTC6 GCCATGAGGG ACACCGAGCC 6ATCGAAAGC 
CTCCGCAGAA GCTCCTTCAG CTGCGACAGC CGGTACTCCC TG3GGCTCGG CTAGCTTTCG 

2470 2480. 2490 2500 2510 2520 

GCGACAAGGA 6TTCGACCCC -GAAATAGCCA AGGTTCAACA GGGAGACGAT GAGGACGACG 
CGCTGTTCCT CAAGCTGG6G CTITATCGGT TCCAAGTT6T CCCTCTGCTA CTCCTGCTGC 

2530 2540 2550 2560 2570 2580 

CGGCGCA66T CG6TATCCAC TCGAAAGGTT CC CT TTCTGG CGAGATTCGC CCTCGGCACT 
6CC6C6TCCA GCCATAGGTG AGCTTTCCAA 6GGAAA6ACC GCICXAASC6 GGA6CCGTGA 

2590 2600 2610 2620 2630 2640 

TTTTTTGGCG AGATTCGCCC TCGGCACTTT GGCACAGGTG TTA6CAGCA6 TTTGCTATCC 
AAAAAACCGC TCTAAGCGGG „ AGCC6TGAM CCGT^CAC AATCGTCGTC AAACGATAGG 

2650 2660\; 2670 2680 2690 2700 

ATAGCACTAG GTTTCGACAT CGGTTCCGTT CACACTGCCG TCGTGCCTGA CGCCCGACAA 
TATC6TGATC CAAAGCTGTA GCCAAGGCAA GTGTGACGGC AGCACGGACT GCGGGCTGTT 

2710 2720 ■ 2730 2740 2750 2760 

• ATCGTCGCGT GGCGCAACTC GGCCGGGSA6 OCGTCGCATG CGTCGmGA CTTTGGGCT6 

TAGCAGCGCA CCGC6TTGA6 CCGGCCCClO CGClWCGIAC GCASCZAACT GAAACCCGAC 

2770 2780 2790 2800 2810 2820 

. CCCGCTTCCT aatcatcaGg TGTTGGATGG TTCCCCCTTG tcgtggcgat ctgggggaat 

GG6CGAAGGA TTAGTAGTCC ' ACAACCTACC AGCACC6CTA GTlCCCCCTTA 

2830 2840 2850 2860 2870 2880 

AATTGG GRAT GTGACGGAT6 GACC CAAA TC GGj^fkTCCTT ATCGCAGCC6 ACCCCGCGAC 
TIAACCCTTA CACTGCCTAC CTGGGTTTA6 CdC^CAGGM^ TAGCGTCGGC TGGGGCGCTG 
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2890 2900 2910 
TGTAGAACGG TCAGGGTTCG CCATCGGGAT 
ACATCTTGCC AGTCCCAAGC QGIAGCCCTA 

2950 2960 2970 
CAATCGGGGC AGGTCGGGGA TCAAGCCGGA 
6TTAGCCCC6 TCCAGCCCCT AGTTCGGCCT 

3010 30?0 3030 

GGGTTTGGAC GCCTCTTCTT CJACGAATCG 
CCCAAACCTG CGGA6AAGAA GAT6CTTAGC 

3070 3080 - 3090 
CATGCGTCGG AGACGACGCG CAAAGGTTCG 
6TACGCAGCC TCTGCTGCGC GtTTCCAAGC 

3130 3140 3150 
AGGCGGGCCG CTCGGGCCCT GACATCGGAA 
TCCGCCCGGC GAGCCCGGGA CT6TAGCCTT 

3190 3200 3210 
GCCCGTGACG CCGTGAGCCA GGA6ACCTGC 
CGGGCACTGC GGCACTCGGT COTCTGGACG 

3250 3260 3270 

CTTTTGTCTC CAACGCCATC ACGGAGGTTG 
GAAAACAGAG Gn^GGTAG TGCCTCCAAC 

3310 3320 3330 
CCCGTGGCGC GTCCGATGGC TTTTGCCACC 
GGGCACCGCG CAGGCTACC6 AAAACGGTGG 

3370 3380 3390 
ACGATGAGCA GTCTCAGCGC CGGGCCCGTG 
TGCTACTCGT CAGAGTCGCG KCCGGGCAC 

3430 3440 ■ 3450 
TCCAGCTTTT CCGAGAGGCT C^TCGAAGCG 
AGGTCGAAAA GGCTCTCCGA GCAGCTTCGC 

3490 3500 3510 
GGCCGCGCCT GGGACGAC6A AATGCGCGAG 
CCGGCGCGGA CCCTGCTGCT TTACGCGCTC 

3550 3560 3570 
GAGGGCTGGA C6ACGCATGA GGAGCCGCTC 
CTCCCGACCT GCT6CGIACT CpTCGGCGAG 

3610 3620 3630 
GATCCCAGCC ATGTG6TCCT GATCGACXGC 
CTAGGGTCGG TACACCAGGA'CTAGCTGACG 

3670 3680 3690 
GAAGAGCGCG ACAT6ACGGC GGAGTTCGCC 
CTTCTCGCGC TGTACTGCCG CCTCAAGCGG 

3730 3740 3750 
GCGCGCCTCG TOTTGTITC CWaGAGGTC 
C6CGCGGAGC AGAAACAAAG GtlACTCCAG 

3790 3800 3810 
6CCCGCGAGT TTCGCGACCA TGCCGGCCGG 
CGGGCGCTCA AAGCGCTGGT , Acggccggcc 



figure; 



. lUffSl 

2920 2930 2940 
TGGTGCCGGG CTGTCGGCCG GTTGCATGGG 
ACCACGGCCC GACAGCCGGC CAACGTACCC 

2980 2990 3000 
AAAGCCACTG GCGTGGCATC GTGATCAGCC 
TTTCGGTGAC CGCACCGIAG CACXAGTCGG 

3040 3050 3060 
TCCGCCTTTC ACGATGTCCC TCACAGCGCC 
AGGCGGAAA6 TGCZACAGGG AGTGTCGCGG 

3100 3110 3120 
CTGTGGCACC GGAAAGACGC CGGGAAGGTG 
GACACCGTGG CCTTTCTGCG GCCCTTCCAC 

3160 3170 3180 
CCTTGCCGtT IAAGG6CGAG GCGATGTTCG 
GGAACGGCAA ATTCCCGCTC CGCIACAAGC 

3220 3230 3240 
CATCGGGCAT GGGCATTCCG CCCGAGGGGA 
GTAGGCCGTA CCCGTAAGGC GGGCTCCCCT 

3280 3290 3300 

TTTTGGCTCG CAGATGTTTT CAAGAACGCG 
aaaAccgagc GTCTACAAAA G TT C TTGCGC 

3340 3350 3360 
6ACGGCTGAT TTGGGAATGT TGAGGCAGCC 
CTGCCGACTA AACCCTTACA ACTCCGTCGG 

3400 3410 3420 
CTGGTQCTTG GCGGCGCCCG TTCCGGCAAG 
GACCAGGAAC CGCCGCGGGC AAGGCCGTTC 

3460 3470 3480 
tccgGcttca CCATGCATIA TGTCGCCACG 
AGGCCGAAGT GGTACG3AAT ACAGCG6T6C 

3520 3530 3540 
CGCATCGACC ATCACCGGAC GCGCCGCGGC 
GCGTAGCTGG TAGTGGCCTG CGCGGCGCCG 

3580 3590 3600 
GATCTCGTCG GCATCCTCAG ACGCATCGAT 
CXAGA6CA6C CGTAGGA6TC TGC6TA6CTA 

3640 3650 3660 
C^GII^CGCIAT GGGTCACCAA TCTCATGCTG 
(^CtGCGATA CCCAGTGGTT AGAGTACGAC 

3700 3710 3720 
GCCCrrGTTG CGTATCTGCC CGAGGCGCGG 
CGGGAAGAAC GCAZAGACG6 GCTCC6CGCC 

3760 + 3770 3780 
GGCCTCGGCA TCGT6CCCGA GAACCGCATG 
CCGGAGCCGT AGCACGGGCT CTXGGCGXAC 

3820 3830 3840 
C3TCACCAGA TC6TTGCGGA OU^ATCCGCT 
gmGtggtct AGCAACGCCT CTTIAGGCGA 

43 . 3 ' 
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3850 3860 3870 3880 3890 3900 

GAA6TTTACT TTGTCGCGGC <CGGTTTGCCG CTGAAAAT6A AGGGTTGATC CATGACCACT 
CTTCAAATGA AACAGCGCCG GCCAAACGGC 6ACTTTTACT TCCCAACXAG GTACTGGTGA 

3910 3920 3930 3940 3950 3960 

GCGAGAGCCA ACCAGGGCAA GATCCCGGCG ACC6TCATCA CCGGCTTCCT CGGCGCCGGC 
CGCTCTCGGT TGGTCCCGTT CTAGGGCCGC TGGCAGIAGT GGCCGAAGGA GCCGCGGCCG 

' 3970 3980 3990 4000 4010 4020 

AAGACGACGA TGATCCGCAA CCTGCTGCAG 'AACGCCGACG GCAAGCGCAT CGGCCTGATC 

» TTCTGCTGCT ACIAGGCGTT G^GACGTC TTGCGGCTGC CGTTCGCGTA GCCGGACTAG 

4030 4040 ! 4050 4060 4070 4080 

ATCAACGA6T TCGGCGATCT TGGCGTC6AC GGC6ATGTCT TGAAGGGCIG CGGTGCCGAG 

* TAGTTGCTCA AGCCGCTAGA ACCGCAGCTG CCGpiACAGA ACTTCCCGAC GCCACGGCTC 

4090 4100 4110 4120 4130 4140 

GCCTGCACCG AGGACGACAT CATCGAGCTC ACCAATGGCT GCATCTGCTG CACC6TGGCT 
CGGACGTGGC TCCTGCT6TA GTAGCTCGAG TGGTTACCGA CGIAGACGAC GTGGCACC6A 

4150 4160 4170 4160 4190 4200 

GACGATTTCA TCCCGACCAT GACGAAGCTC CTCGAGCGTG AAAACCGTCC TGACCACATC 
CTGCTAAAGT AGGGGTGGXA CTGCTTCGAC 6AGCTCGCAC TTTTGGCAGG ACTGGTGTAG 

4210 4220 4230 4240 4250 4260 

ATCATC6AAA CCTCGGGCCT TGCCCTGCCG CAGCCGCTGA TCGCCGCTTT CAACTGGCCG 
TAGTAGCTTT GGAGCCCGGA AGGGGACGGC GTCGGCGACT AGCGGCGAAA GTTGACCGGC 

4270 4280 - 4290 4300 4310 4320 

GATATCCGCA GCGAAGTGAC CGTCGATCGC GTCCTtACCG TGGTCGACAG CGCCGCCGTT 

ctataggcgt cgcttcactg gcagctacqg cagcagtggc accagctgtc gcggcggcaa 

4330 4340 4350 4360 - 4370 4380 

GCCGCTGGCC GCTTTGCC6A CGACCACGAC AAGGTCGATG CGCTGCGCGT CGAGGACGAC 

cggcgaccgg cgaaacggct gck^gctg ttccagctac gcgacgcgca gctcctgctg 

4390 4400 4410 4420 4430 4440 

aatctcgatc acgaaagccc gatcgaggag ctgttcgagg atcaactgac ggctgccgat 
ttagagctag tgctttcggg ctaGctcctc gacaagctcc tagttgactg ccgacggcta 

4450 4460 4470 4480 4490 4500 

CTCATC6TTC TCAACAAGAC CGATCTGATC GATGCCTCC6 GCCTCAAGGC C6TGC6CGAC 
6A6TAGCAAG AGTTGTTClG GCXAGACTM3 CXACGGAGGC CGGAGTTCC6 GCACGCGCTG 

X*. ... 

4510 4520 4530 . 4540 4550 4560 

GAGGTGTCTT CGCGOICCAG (SGCAAGCCC ACGATGATCG AGGCGAAAAA C66CGAAGTC 
CTCCACAGAA GCGCGTGGTC GGCGTtCGGG TGCTACIA6C TCCGCTTTTT GCCGCTTCAG 

4570 4580 4590 , 4600 4610 4620 

GCCGCTGCCA TCCTGCITGG CCTCG6T6TC GGCACG6AAA GCGATATCGC CAACCGCAAG 
CGGCGACGGT AGGACGAACC 66AGCCACAG CCGTGCCTIT CGCTATAGC6 GTTGGC6TTC 

4630 4640 4650 4660 4670 4680 

TCGCATCACG AGATGGAGCA CGAGGCAGGT GAGGAGCAC6 ATCACGAQ^A GTTCGACAGC 
AGCGTAGTGC TCTACCTCGT GCTCCGTCCA CTCCTCGTGC. TA6TGCTGCT CAAGCTGTCG 

» 4690 4700 , 4710 ' 4720 4730 4740 

TTCGTCGTCG AGCTCGGTTC ^ICGCCGAT CCG6CC6CCT TCATCGATC6 CCTGAAGGGC 
AAGCA6CAGC TCGAGCCAAG^CIAGCGGCTA GGCOSGCGGA AGXAGCXAGC GGACTTCCCG 

» 4750 ,4760 4770 4780 4790 4800 

GIAATCGCGG AGCACGACOT jlCTGCGCCTC AAGGGTTTTG CA6AC6TGCC CGGCAAGCCG 
CAITAGCGCC TC6TGCTGCA' AGACGCGGAG TTCCCAAAAC- 6TCTGCAC66 GCC6TTCGGC 

! ' ■ 

4810 4820 4830 4840 4850 4860 
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ATGCGCCTCC TSATCCAGGC GGTCGGCGCC 
TACGCG6AG6 ACTAG6TCC6 CCftGGCGCGG 

4870 48ro 4890 
GGCGCTGGC6 AAAAGCGCG6 t&CGCGCCTC 
CCGCGACCGC TTTTCGCGCC A^GCGGAG 

4930' 4940^;' 4950 
GCGGCGGTGC GCGCCGCGAT CACCGCGCTC 
CGCCGCCACG CGCGGCGCTA GTGGCGCGA6 

4990 5000 • 5010 
AACGCATTGA AATGATGCAG TTCCGGATGG 
TTGCGTAACT TTACTACGTC AAgGCCTACC 

5050 5060 5070 
GCCCCAACGG ACAAGACGAA TGCATCTGCT 
CGGGGTTGCC TGTTCTGCTT ACGXAGACGA 

5110 5120 5130 
CAACGAGGCG ATCGACCTTG GSCAAACGCC 
GTTGCTCCGC TAGCTGGAAC CpGTtTGCa 

5170 5180 ; 5190 
CACCGAGCTC TCCTCGATCG QGGCGGCTCA 
GTGGCTC6AG AGG&GCTAGC GGCGCCGAGT 

5230 5240 5250 
CATCGCCAGC CTGATGAGCC tgatgcaccc 
GTAGCGGTCG GACTACTCGG ACTACGTGGG 

5290 5300 i 5310 
GGCGCGTCAC GCCAAGCTGA ffcGTCGTCCG 
CC6CGCAGTG CGGTTCGACT AGCAGCAGGC 

5350 5360 V 5370 
TCTGCTGGAA GCCCTGCAT6 CSGCTGCCGT 
AGACGACCTT CGGGACGTAC G(X6ACGGCA 

5410 5420 5430 
GGGT6ACGAC AAGCCGGATC CGGGGCTGGA 
CCCACTGCTG TTCGGCCTAG GCCCCGACCT 

5470 5480 5490 
CCAGCGCCTT TGGGCTTACT TCACCGAAGG 
GGTCGCGGAA ACCCGAATGA AGXGGCITCC 

5530 5540 5550 
CTAT6C6GCC GCACTGGTtiA CAGGTGCGGA 
GA3ACGCCGG CGT6ACCACT GTCCACGCCT 

5590 5600 5610 
GGCCGGCATC TGGTGGCCGG GTGCTGGTGT 
CCGGCCGTAG ACCACCGGCC CAOGACCACA 

5650 5660 ; • 5670 
TCAGGGACGG ATGGTAGiiGA GGGAGGGAIT 
AGTCCCTGCC lACCATCGCT CCCTCCCTAA 

5710 5720 5730 
CCGCGCGCTC GTGCAGAGTG GCGASACACG 
GGC6CGCGAG CACGTCTCAC 06 crCtGTGC 

5770 5780 5790 
GGCTGAA6ST 6TGCGGGCAC TGCCGGTGTT 



CGCATCGACC AATATTAC6A CCGCGCCTGG 
GCG!^GCT6G T7ATAATGCT 6GCGCGGACC 

. 4900 4910 4920 
6TCGTCATCG GCCTGCACGA CATGGACGA6 
CAGCAGTAGC CGGACGTGCT GTACCTGCTC 

4960 4970 4980 
GTGTAGATCG TTCTTTGAAT GAAATGATCT 
CACATCTAGC AAGAAACTTA CTTTACTAGA 

5020 5030 5040 
A6AACGCTTT TAGCGTTTTC GTTCGGAATT 
TCTTGC6AAA ATCGpUVAAG CAAGCCTTAA 

5080 5090 5100 
TCTCGCCCA6 AAAGGAACGA TCGCCGACGG 
AGAGCGGGTC TTTCCTTGCT A6CGGCTGCC 

5140 5150 5160 
G6CCGATATC CTTTTCCTAT CGGCC6CCGA 
CC'G(^ATA6 GAAAAGGATA GCCGGCGGCT 

5200 5210 5220 
CGGCCGACGC GACGGAGGCT TGAGCCTGCG 
GCCGGCTGCG CTGCCTCC6A ACTCGGACGC 

5260 5270 5280 
GATGTCGGTC GACACTTACG TCGAGCGCAC 
CTACAGCC3M3 CTGTGAATGC AGCTCGCGTG 

5320 5330 5340 
GCCGCTCGGT GGCGCCAGCT ATTTCCGTTA 
CGGCGAGCCA CCGCG6TCGA TAAAGGCAAT 

5380 5390 5400 
CACCCATCGT TTCGAGATCG CGGTTCTGCC 
GTGGGTAGCA aagctctagc gccaagacgg 

5440 5450 5460 
GCCTTTCTCC ACCGTCGCAG CCGACGACCG 
CGGAAAGAGG TGGCAGCGTC GGCTGCTGGC 

5500 5510 5520 
CGGCTC6GAC AATGCCGGGC T G TTTCTCGA 
GCCGAGCCTG mCGGCCCG ACAAAGAGCT 

5560 5570 5580 
6MGCCGCA6 CCGGCAAAGC CCCT6TTGAA 
CTTCG6C6TC GGCCGTRCG GGGACAACTT 

5620 5630 5640 
gKTCGGCGTC AGCGAATGGC AGTCCCTTGT 
CUkGCCGCkS TCGCTXACCG TCAGGGAACA 

.5680 5690 5700 
CGAACCCCCG ACGGTCGGGA TCTGCTTTXA 
GCTTGGGGGC TGCCAGCCCr AGACGAAAAT 

5740 5750 5760 
GCCTGTGGA6 GCGCTCATC6 ATGCGCTGGA 
CGGACACCTC CGCGACZAGC ZACGCGACCT 

! 5800 5810 5820 

tgtcicaagc CTCAAGGATG CCGTZTCCGT 
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CC6ACTTCCA CACGCCC(^;;ACGGCCACAA ACASAGTTCG GA6TTCCIAC GGCAMGGCA 

5650 ; 5860 5870 5880 

SSSiSSSFS CA6GCGATTT TTTCCGAGGC CGCftCCCGAC GTGGT6ATGA ACGCCACTGG 
GCCGTGCGAC GTCCGCTAAA AAAGGCTCCG GCGTGGGCTG CACCACTACT TGCGGTGACC 



5890 5900 5910 : - 5920 5930 5940 
CTTTGCGGTC TCGTCGCCCG GTGCCGACCG TCAGCCGACG GTGCTGGAAT CGACCGGTGC 
GAAACGCCAG AGCAGCQ$A:’ »OGGCTGGC AGTCGGCTGC CACGACCTTA GCTGGCCACG 

5950 5960*’- 5970 5980 5990 6000 
GCCGGTGCTG CAGGTGATrrT TCTCCGGCTC GTCGCGGGCG CAATGG6AAA CGTCGCCGCA 
CGGCCACGAC GTCGACTAAA 'AGAGGCCQAG CAGCGCCCGC GTTACCCTTT GCAGCGGCGT 



6010 6020 6030 
GGGGCTGAT6 GCGCGCGACC TCGCCATGAA 
CCCCGACTAC CGCGCGCTGG’AGCiGGTACTT 



€040 €050 €060 
CGTGGCACTC CCCGAAGTCG ATGGCCGCAT 
GCACCGTGAG GGGCTTCAGC TACCGGCGTA 



6070 6080 6090 6100 6110 6120 
CCTTGCGCGC GCCGTCTCCT TCAAGGCGGC GTCGATCTAT GACGCCAAGG TGGAGGCCAA 
GGAACGCGCG CGGGAGAGGA AGTTCCGCCG CAGCTAGATA CTGCGGTTCC ACCTCCGGTT 



6130 6140 6150 6160 6170 6180 

TATCGTCGGC CATGAGCCGC JCGAAGGCCG GGTGCGCTTT GCCGCTGATC TTGCCGTCAA 

ATAGCAGCCG GTACTCGGCG AGCTTCCGGC CCACGCGAAA CGGCGACTAG AACGGCAGTT 

6190 6200 6210 6220 6230 6240 

CTGGGCGAAC 6TGC6CCGGG CAGAGCCCGC CGAGCGCCGT ATTGCCATCG TCATGGCCAA 

GACCCGCTTG CACGCGGCCC. «TCTCGGGCG GCTCGCGGCA TAACGGTAGC A6TACCGGTT 

6250 6260 6270 6280 6290 6300 

CTATCCGAAC CGCGACGGTC GCCTCGGCAA CGGTGTCGGG CTCGACACGC CGGCCGGTAC 

GATAGGCTTG GCGCTGCCAG CGGAGCCGTT GCCACAGCCC GAGCTGTGCG GCCGGCCAXG 



6320 6330 6340 6350 6360 

CGTCGAGGTG CTTAGCGCCA TGGCGCGGGA AGGCTATGCG GTCGGTGAGG ttcccgccga 

gcagctccac gaatcgcggt ACCGCGCCCT tccgatacgc cagccactcc aagggcggct 



6370 6380 6390 6400 6410 

tggcgacgcg ctgatccgct ttctgatggc cgggccgacc aatgcggcga 

ACCGCTGCGC GACTAGGCGA AAGACTACXJS GCCC6GCTGG TTACGCCGCT 



6420 

GCCAT6ACCG 

C6GTACTGGC 



6430 6440 6450 6460 6470 6480 
T6AAATCCGC GAGCGTATTT CGCTGAACGA TTACAAAAQG TT C CTCGATT CGCTTCCGAA 
ACTTTAGGCG CTC6CATAAA GCGACTTGCT KO&iTTTQC AAGAAGCTAA 6CGAAGGCTT 



6490 6500 6519 ^ 6520 6530 6540 
ACAGATAAAG GATGAAGTTG CCGGTCGCTS GGGC6TGCCG GAGGCCGATC C C TTTTTCCT 
TGTCTATTTC CIACTTCAAC GGCCAGCGAC CCCGCACGGC CICCGGCTAG GGAAAAAGGA 

* .**,'■ s 

6550 6560 K 6570 6580 6590 6600 
CGATGGCGCC TTCGCGCTGC CGCTCGCCCG CTTCGGCGAG GTGATCGTC6 GCATCCAACC 
GCTACCGCGG AAGCGCGACG^ GCGAGCGGGC GAAGCCGCTC CACTAGCAGC CGTAG6TTGG 

6610 6620 6630 6640 6650 6660 
GGCGCGCGGC TACAACATCG ATOCGAAGG^ -AAGCTACCAT TCCCOGGACC TCGTGCCGCC 
CCGCGCGCCG AT6TT6TAGC T^GGCTTCGC TTCGAIG6IA AGGGGCCTGG AGCACGGCGG 



6670 6680 . 6690 6700 
GCATGGCIAT CTCGCCTTCT ACGCCTTCCT GCGCCAGCAG 
CGIACCOm GAGCGGAAGA TGCGbAAGGA CGCGGTCGTC 

;■ 'rh, ' 

6730 6740 6750 : 6760 
CCACATGGGC AAGCACGGCA ATCTCGAATG ;GCTGCCGGGC 
GGT6IACCCG TIC6TGCCGT TAGAGGITAC eGA^GGCCCG 



6710 6720 
TICGGAGCGC AGGCGATC6T 
AAGCCTCGC6 TCCGCZAGCA 

6770 6780 
AA6GC6CT66 CGCTGTCGGA 
TTCCGCGACC GCGACAGCCT 
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€790 €600 6610 6820 6830 €840 
AACCTGCTAT CCCGAAGCGA ITCrTCOSGCG GCTGCCGCAC ATCTATCCCT TCATC6TCAA 
TTGGACGATA GGGCTTCGCT A(»AGCCCGG CGACGGCGT6 TAGATAGGGA AGTAGCAGTT 

6850 €860 6870 6880 6890 6900 
CGATCCGGGC GAAGGIACGC AGGCCAAGCG CCGCACCAGC GCCGTCATCA TCGACCACCT 
GCTAGGCCCG CTTCCATGCG TCCGGTTOX: GGCGTGGT^^ CGGCAGTACT AGCTGGTGGA 

6910 €920 6930 6940 6950 6960 
GACCCCGCCC TTGACGCGCG CCGAAtCXIA CGGCCCGCTC AAGGATCTGG AAGCGCTCGT 
CTGGGGCGGG AACTGCGCGC,G(SS±l»GGAr GCCG^ TTCCTAGACC TTCGCGAGCA 

6970 €980 6990 7000 7010 7020 
CGAC6AATAT TACGACGCC6 GCGGGG6T6A TCCGCGCCGC CTCAGGCTGC TCAGCCGCCA 
GCTGCTTATA ATGCTGCGGC (I(^GCCACT AGGC6CGGC6 GA6TCCGACG AGTCGGCGGT 

7030 7040 ' 7050 7060 _ 7070 7080 
GATCCTCGAT CTCGTGCGCG A^ATCGGCCT CGACAGCGAC GCAGGCATCG ACAGGGGCGA 
CTAGGAGCTA GAGCACGCGC $GlAGCCGGA GCT6TCGCTG CGTCCGTAGC TGTCCCCGCT 



7090 7100 7110 7120 7130 7140 
CAGCGACGAC AAGGCGCTGG AAAAGCTCGA CGCCIATCTC TGCGACCTCA AGGAAATGCA 
GTCGCTGCTG TTCCGCGACC TTTTCGAGCT GCGGATAGAG ACGCTG6AGT TCCTTTAC6T 

7150 7160 7170 7180 7190 7200 

gatccgcgac ggcctgcaca tcttcggcgt tgcgccggaa gggcggttgt tgacggacct 

CTAGGCGCTG CCGGAG6TGT AGAAGCCGCA ACGCGGCCTT CCCGCCAACA ACTGCCTGGA 

7210 7220 7230 7240 7250 7260 
CACCGTAGCG CTGGCGCGCG TGCCCCGAGG TCTCGGC6AG GGCGGCGACC AGAGCCTGCA 
GTGGCATCGC GACCGCGCGC AGGGGGCTCC AGAGCGGCTC CGGCCGCTGG TGTGGGACGT 

7270 7280 7290 7300 7310 7320 
GGGGGGGATC GGAGCGGATG CGGGGCTGGG TGGGTTTGCT ATTCCGAGCT CGGGGGGGGG 
CGCCCGCTAG CGTCGCCTAG GCCGGGACGG AGCGAAAGGA TAAGGGTGGA GCCGCCCGCC 

7330 7340 7350 7360 7370 7380 
CAACCCCGCA CGCGACGCCC AACCCTTCGA CCCGCTCGAC TGCGTCATGT CCGACACCTG 
GTTGGGGC6T GCGGTGCGGG tTGGGAAGCT 6GGCGAGCTG ACGCAGTACA GGCTGTGGAC 

7390 : 7400 7410 7420 7430 7440 
GACAGGCCCG AAACCGTCCA; TCCTCGCTGA CC1CTC6GAC GCCCCCTGGC GCACCGCCGG 
CTGTCCGGGC TTTGGCAGGT AGGAGCGAGT GG^GCCTG.CGGGGSACCG CGTGGCGGGG 

7450 7460 7470 7480 7490 7500 
C^TACGGTG GAGC6CATG6 AOTTGCTTGC CGCAAATCTC GT6TCGGGT6 AACTGGGTTG 
GCTATGCCAG CTCGGGTAGC TGAAGGAAG6 GGGT31AGAG CACAGCCCAC TTGACCGAAC 

7510 7520 7530 7540 7550 7560 
CCCGGACCAG TGGGCCAACA CCCGCGCCGT GCTC6GCGAA ATCGAAACGC GCCTGAAGCC 
GGGCCTG6TG ACCGGGTTGT GGGCGCGGCA CGAGCCGCTT ZAGCTTTGCG CGGACTTCGG 

7570 7580 7590 7600 7610 7620 
GTCGATTTCA AACTCGGGTG l^GCCGAGAT GACCGGCTTC CTCACCGGIC TCAGCGGCCG 
CAGCXMAGT TTGAGCCCAC GGCGGCTCTA CTGGCCGM^ GAGTGGCCAG AGTCGCCGGG 

M ’ 

7630 7640! 7650 7660 7670 7680 
CTTCGTCGCC CCGGGTGCAf GGGGCGGGGG GAGGCGCGGC CGGCCGGATG T G IT G CCGAG 
GMSSCkQCGG GGGC(»GGTA,;GGCCGCGCGG CTGCGCGCCG GCCGGCCTAC ACAACGGCTG 

7690 7700 7710 7720 7730 7740 
GGGGC6CAAT TTCTACTCGG TGGACAGCCG CGCCGTGCC6 ACGCC6GCG6 CTTACGAGCT 
CCCCGCGTTA AAGATGAGCC ; ASCTGTC66C GC0GCAC66C TGC6GCC6CC 6AATGCTC6A 
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7750 7760 7770 7780 7790 7800 

TGGCAAGAAA TCGGCCGAGC TTCT6ATCC6 CCGCTACCT6 CAGGACCATG GC6AATGGCC 
ACC6TTCTTT AGCCGGCTCG AAGACIAGGC GGCGATGGAC GTCCTSeTAC CGCTTACCGG 

7810 • 7820 7830 7840 7850 7860 

GTCCTCCTTT GGCCTGACCG CCTCGGGCAC GGCGAACATG CGCACCGGCG GCGACGACAT 
CAGGAGGAAA CCGGACTGGC GGACCCtoiG CCGCTTGXAC GCGTGGCCGC CGCTGCT6IA 

♦ 7870 7880 7890 7900 7910 7920 

CGCCCAGGCC CTGGCGCTGA TCGGCGCCAA GCCCACCTGG GACATGGTCT CTCGCCGGGT 
GCGGGTCCGG GACCGCGACT ASC^GGTT CGGGTGGACC CTGTACCAGA GAGCGGCCCA 

» 7930 7940 7950 : 7960 7970 7980 

GATGGGCTAC GAGATCGTGC CGCTCGCAGT CCTCGGCCGC CCACGCGTCG AC6T6ACCTT 
CTACCCGATG CTCTAGCACG GdGAGCGTCA SGAGCCGGCG GGTGCGCAGC TGCACIGGAA 

7990 8000 8010 8020 8030 8040 

GCGCATTTCC GGCTTCTTCC GCGATGCCTT CCCGGACXI^G ATCGCGCTCT TCGACAAGGC 
CGCGTARAGG CCGAAGAAGG CGCIACGGAA GGGCGTGGTC TAGCGCGAGA AGCTGTTCCG 

8050 8060 8070 ' 8080 8090 8100 

GATCCGCGCC GTCGCGCTGG AGGAAGACGA TGCCGACAAC ATGATCGCCG CACGCATGCG 
CTAGGCGCGG CAGCGCGACC TCCTTCTGCT AtaSGGTGTTG TACTAGCGGC GTGCGTACGC 

8110 8120 8130 8140 8150 8160 

GGCG6 AAA GC CGGCGGCTGG AGGCC6AAGG CGTG6AAGCC GCCGAGGCCG CGCGTCGCGC 
CCGCCTTTCG GCCGCCGACC TCCGGCTTCC 6CACCTTCG6 CGGCTCCGGC GCGCAGCGCG 

8170 8180 • 8190 8200 8210 8220 

CTCCTACC6C GTCTTTGGCG CAAGCCCGG TGCCTATGGC GCCGCCCTGC AGGCGCTGAT 
GAGGATGGCG CAGAAACCG? GTTTCGGGCC AGGGATACCG CGGCGGGACG TCCGCGACTA 

8230 8240 . 8250 8260 8270 8280 

CGACGAGAAG GGCTGGGAAA CCAAAGCAGA TCTCGCCGAG GCCTATCTTA CCTGGGGCGC 
GCTGCTCTTC CCGACCClTT GGITTCGTCT AGAGCGGCTC CGGATAGAAT GGACCCCGCG 

8290 8300 8310 8320 8330 8340 

CTATGCCTAT GGCGCCGGCG AGGAGGGCAA GGCCGAGCGC GAT C TTTTCG AGGAGCGCCT 
GATACGGATA CCGCGGCCGC TCCTCCCGXT''CCGGCTCGCG CTAGAAAAGC TCCTCGCGGA 

8350 8360 ; 8370 8380 8390 8400 

GCGCAC6ATA GAG6CGGTGG T^GAACCA GGACAACCGC GAGCACGATC TGCTCGACA6 
CGCGTGCTAT CTCCGCCACC AtGTCTTGGT CCTGTTGGCG CTCGIGCIAG ACGAGCTGTC 

8410 8420 8430 8440 8450 8460 

CGACGACTAC TACCAGTTCG AAGGCGGCAT GAGC6CTGCC GCCOUiCAGC TCGGCGGTCA 

gctgctgatg atggtcaagc ttcogccgxa ctcgcgacgg cggcttgtcg agccgccagt 

8470 8480 8490 8500 8510 8520 

CC6TCCGGCG ATCTACCACA ACGACCATTC CCGTCCGGAA AAGCCT6TGA TCCGGICGCT 
GGCAGGCCGC IA(ATGGTGT TGCI!(^AAG (^CAGGCCTT TTCGGACACT AGGCCAGCGA 

8530 8540 8550 8560 8570 8580 

CGAA6AAGA6 ATCGGCCGCG TOGTCCGGGC CCGCGTC6TC AATCCCAA6T GGATCGATGG 
^ GCTTCTTCTC lAGCCGGCGC AOaGGCCCG GGCGCAGCA6 TTAGGGTTCA CCIAGCTACC 

8590 8600 8610 8620 8630 8640 

CGTCATGCGC CACGGATACA AGGGCGCCTT CGAGATCGCT GCCAOGGTCG ACXACATGTT 
, GCAGTACGCG GTGCCIATGT ^CCGCGGAA GCTCTAGCGA CGGTGCdujc IGRTGIACAA 

8650 8660 ' , 8670. 8680 8690 8700 

CGCCTTTGCC GCGACCACGG GXGCGGTWG CGACXATCAT TTCGAGGCCG CTTATCAGGC 
GCGGAAACGG CGCTGGTGCC CACGCCACGC GCTG6ZAGTA AAGCTCC6GC GAAXAGTCCG 
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8710 8720' 8730 - 8740 8750 8760 
GTTCMTGTC GACGAGCGCG' TGGCTGACTT CATGCGCGAC AAGAACCCGG CCGCCTTTGC 
CAAGTAACAG CTGCTCGCGC AC05ACTGAA GXACGCGCTG TTCTTGGGCC GGCGGAAACG 

8770 8780 8790 8800 8810 8820 
CGAGCTTGCC GAACGCCTGC TTGAAGCAAT CGACCGCAAT CTCTGGACGC CGCGCTCGAA 

gctcgaacgg cttgcggacg aacttcgtta gctggcgtta gagacctgcg gcgcgagctt 
8830 8840 8850 8860 8870 8880 

ttcggcgcgg tttgaacttg ccggcatcgg cacggcagca acccggcttc gtgccggcaa 

AAGCCGCGCC AAACTTGAAC SfeCCGTAGCC GIGCCGTCGT TGGGCCGAAG CACGGCC6TT 

8890 8900 : 8910 8920 8930 8940 
T6AATAGAGC GGTTCCGGGC TGGCGGTTAT CCGTCCGGAA TTGCTTCGAA ACAAAGACCT 
ACTIATCTCG CCAAGGCCCG A^CGCCAATA GGCAGGCCTT AACGAACCTT TGTTTCTGGA 

8950 8960 8970 8980 8990 ' 9000 
GGTTCCGTTT CGCTGCTCAG TGAAGTGC6A AAAGGAACCG AAGCGGGACG AGGGCGTCTG 
CCAAGGCAAA GC6ACGAGTC ACTTCACGOr TTTCCTTGGC TTCGCCCTGC TCCCGCAGAC 

9010 9020 9030 9040 9050 9060 
CCCATCCCGA ACTTGAGAAC TGAGGGAGT6 ATCATGAGCG ACGAGACGAC AGTAGGCGGC 
GG6TAGGGCT TGAACTCTTG ACTCCCTCAC TAGTACTCGC TGCTCTGCTG TCATCCGCCG 

9070 :9080 9090 9100 9110 9120 
GAAGCCCCGG CCGAGMGGA CGATGCCCGC CACGCCATGA A6ATGGCGAA GAAGAAGGCA 
CTTCGGGGCC GGCTCTTCCT GCTACGGGCG GTGCGGTACT TCTACCGCTT CTTCTTCCGT 

9130 9140 9150 9160 9170 9180 
GCACGCGAAA AGATCATGGC GACGAAGACC GACGAGAAGG GTCTGATCAT CGTCAACACC 
CGTGCGCTTT TCTAGTACCG CTGCTTCTGG CTGCTCTTCC CAGACTAGTA GCAGTTGTGG 

9190 9200 ' 9210 ’ 9220 9230 9240 
GGCAAAGGCA AGGGCAAGTC ^CCGCCGGC TTCGGCATGA TCTTCCGCCA TATCGCCCAC 
CCGTTTCCGT TCCCGTTCAG CTGGCGGCCG AAGCCGIACT AGAAGGCGGT ATAGCGGGTG 

9250 9260 9270 9280 9290 9300 
GGCATGCCCT GCGCCGTCGT SCAGTTCATC AAGGGTGCGA TGGCAACCGG CGAGCGCGAG 
CCGTACGGGA CGCGGCAGGA tlGIGAAGTAG TTCCCACGCT ACCGTTGGCC GCTCGCGCTC 

9310 9320 ; 9330 9340 9350 9360 
TTGATCGAGA AGCATTTCGG CGATGTCTGC CAGTTCTACA CGCTCGGCGA GGGCTTCACC 
AACTAGCTCT TCCTAAAGCC GCIACAGACG GTCAAGATGT GCGAGCCGCT CCCGAA6TGG 

9370 • 9360 9390 9400 9410 9420 
TGGOAACGC AGGATCGCGC CCGCGATGTT GCGATGGCTG AAAAGGCCTG 6GAGAAG6CG 
ACCCTTTGCG TCpTAGCGCG GGCGCTACAA CGCTACCGAC TTTTCCGGAC CCTCTTCCGC 

9430 9440 9450 9460 9470 9480 
AAGGAACTGA TCCGTGACGA GCGCAACTCG ATGGTGCTGC TCGACGA6AT CAACATTGCT 
TTCCTTGACT AGGCACTGCT OGCGTTGAGC TACCACGACG AGCTGCTCXA GTTGXAACGA 

9490 9500 9510 9520 9530 9540 
CTGCGCTACG ACTACATCGA CGXCGlXGAA GTGGTGCGCT TCCTGAAGGA AGAAAAGCC6 
GACGCGATGC TGATGTAGCt GCAGCGGCIT CACCACGCGA AGGACTTCCT TCTTTTCGGC 

9550 9560 9570 9580 9590 9600 
CACATCACGC ATGTGGTGCT CACC6GCCGC AACGC6AAAG AAGACCT6AT CGAA6TCGCC 
GT6TACTGCG TACACttCGA GTGGCCGGCG TTGCGCTTTC TTCTG6ACIA GCTTCAGCGG 

9610 9620 9630 9640 9650 9660 
OITCTCGTCA CTGAGATGGA GCTGATCAAG OVTCCGTTCC GXTCCGGCAT CAAGGCGCAG 
CTAGAGCAGT 6ACTCTACCT OGACTAGTTC G7»|GCAAGG CAAGGCCGIA GTTCCGCGTC 

9670 9680 9690 9700 9710 9720 

FIGURE 43.9 



FEUILLE DE REMPLAGEMENT 




wo 91/11518 



PCT/FR91/00054 



♦ 






PL. 

CAGGGCGTGG AGTTCTGATG AGCCAGAStf 
GTCCCGCACC TCAAGACTAC TCaSrCTCGA 

9730 9740 ^ 9750 

TCGCTGCGCT CACGGCGGT6 TPTGCCAAGG 
AGCGACGCGA GTGCCGCCAC AAACGGTTCC 

9790 9800 9810 

CAACGCTGAT CCQCACCGTC GTCATCCTCT 
GTTGCGACXA GGCGTGGCAG CAGTAGGAGA 

9850 9880 9870 

GGCAGTGGCA GAAGCCATCG GAAATCCCGG 
CCGTCACCGT CTTCGGTAGC C^ITAGGGCC 

9010 9920 9930 

GGCTTGCGAC TGGCGCTTCC TGGCTTGCCT 
CCGAACGCTG ACC6CGAAG6 ACCGAACGGA 

9970 9980 9990 

CCCGC6TGGC GCCGCTCGAC AAGGTCTCGA 
GGGCGCACC6 CGGC6AGCTG TTCGAGAGCT 

10030 10040 10050 

TCCTCGGTGA AAAGCTCAAC CTGATGAACT 
AGGAGCCACT TTTCGAGTTG GACTACTTGA 

10090 10100 10110 

CGCTGTTGCT GGCGGTGTTT TGAGCGCGCC 
GCGACAAC6A CCGCCACAAA ACTCGCGCGG 

10150 10160 10170 

CTCAATCAAT CCGTAATCCC GACACATGCA 
GAGTTAGTTA GGCATTAGGG CTGTGTACGT 

10210 10220 10230 
AGATTGAAGG CAATTGGAGC GAGCGCCTTC 
TCXAACTTCC GTTAACCTCG CTCGCGGAAG 

10270 10280 10290 

GCAGACGCTG GAAGCGTCGC AGCCTGAGGG 
CGTCTGCGAC CTTCGCAGCG TCGGACTCCC 

10330 10340 10350 

CGCCTGCAAT AGGCACCGTA GGCGTCGCC6 
GCGGAC6TTA TCCGTGGCAT CCGCAGCGGC 

10390 10400 10410 

CGGATCTGGT AGGAAATCGA GATCCAG6C6 
GCCIAGACCA TCCTTTAGCt CSAGGTCCGC 

10450 10480 1047d 

GGCACCGCCA TCACC6TGCC GATCAGC6C6 
CC6TGGCGGT AGTGGCACGG CIAGTCGCGC 

10510 10520 10530 

GAGAAGGCAT AGAGGCCT6A GSICACAAGC 
CTCTTCC6TA TCTCCGGACT Q^TGTTCG 

10570 10580 10590 

TTCCAGGAAT GACGCATCGC #i»TTGCGAC 
AAGGTCCTTA CTGCGTAGCG GOXAACGCZG 

10630 10640 * 10650 

AGCGCCAGGC CGACG6C6T6 AAGGATGGGC 



121 1 1 S') 

GGCAGTTCTG ggcgctgctt tcggccgcct 
CCGTCAAGAC CCGCGACGAA AGCCGGCGGA 

9760 9770 9780 

TCGGGGTTGC GCAGATCAAC TCC6ACTTCG 
AGCCCCAACG CGTCIAGTTG AGGCTGAAGC 

9820 9830 9840 

GCGTGATCGC CGCCATCGTG GCGGCGACAG 
CGCACTAGCG GCGGIAGCAC CGCCGCTGTC 

9880 9890 9900 

GCCGCACCTG GCTGTTCCTG GCGCTKTCAG 
CGGCGTGGAC CGACAAGGAC CGCGACAGTC 

' 9940. 9950 9960 

AOTTCCGCGC GCTGAAGCTC GGCGACGCCG 
lAAAGGCGCG CGACTTCGAG CCGCTGCGGC 

10000 10010 10020 
TCGTCATGGT CGCGATCTTC GGCGTGCTCT 
AGCACTACCA GCGCTAGAAG CC6CACGAGA 

10060 10070 10080 

GGCTCGGCGT CGCCTTCATT GCCGCCGGGG 
CCGAMCGCA GCGGAAGTAA CGGCGGCCCC 

10120 10X30 10140 

TGCTCTGGTG CCTGTTCACT GAATGCTCGC 
ACGAGACCAC GGACAAGTGA CXXACGAGCG 

10180 10190 10200 

GTGGTTGTGA CGAGCGGGAG GACGGCATGC 
CACCAACACT GCTCGCCCTC CTGCCGTACG 

10240 10250 10260 

CTGATCCGTC GGGCCACGTC GCGCAGTTCG 
GACTAGGCAG CCCGGTGCAG CGCGTCAAGC 

10300 10310 10320 

TGAGCCCTGC TTCAGACCCA CCGGCGGACA 
ACTCGGGACG AAGTCTGGGT GGCCGCCTGT 

10360 10370 10380 

AAGACC1TG6 CGAGGTG66T TTCCTCCAT6 
TTCTGGAACC GCTCCACCCA AAGGAGGtAC 

10420 10430 10440 

GAGASCGCCA GC6CCACCGA GAT6ACGTT6 
CTCTCGCG6T CGCGGTGGCT CTACTGCAAC 

10480 10490 10500 

6TCACCATGC CGACATAGAT CGGGTTGC6C 
CAGTG6TACG GCTGTATCTA GCCCAACGC6 

10540 10550 10560 

GGCGC6TCCT GCTXTTCAGG GATGCCGATC 
CC6CSCAGGA CGAAAA6TCC CZACGGCTAG 

10600 10610 10620 
AGCATCGICA GCCCGCCGCC GAGCGTCATC 
TCGTAGCAGT CGGGCGGCGG CTCGCAGIAG 

10660 10670 10680 

CT6TCGAGC6 CCGGGATCCG GCCGAGG6CA 
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PL. 

TCGCGGTCCG GCTGCCGCAC TTOCTACCCG 

10690 10700 10710 

GCATCGACGG AGGCCGG6A&: CA7GGCGACC 
CGTAGCTGCC TCCGGCCCTC GTACCGCIGG 

10750 10760 10770 

ATCAGGCGGA AAAGCCTGCC CGCAAACCCT 
TAGTCCGCCT ITTCGGACGG GCGTTTGGGA 

10810 10820 10830 
GGCGAGCGGC CGGA3TGCAC GCGGCGGAGG 
CCGCTCGCCG GCCTAAC6TG CGCCGCCTCC 



12zhS} 

CACAGCTCGC GGCCCTAGGC CGGCTCCCGT 

10720 10730 10740 
GCCAGCAG6T GGATCACCAG CGCTGC6ACG 
CGGTCGTCCA CCTAGTGGTC GCGACGCTGC 

10780 10790 10800 
TCCGCATCGT CGCCATAGGT TAGCACGACC 
AGGCSTAGCA GCGGXATCCA ATCGTGCTGG 

10840 10850 10860 
ATCGCCA6CG CGAGCGTG6A CAATCCCACG 
TAGCGGtCGC GCTCCCACCT GTIAGGGTGC 



10870 10880 10890 10900 10910 10920 
ACGAGCATCA G6ATGGTGGG AAGGGTGGTG 6ACATGGAAA CCTCTG6AGC GAGCTGACAA 
TGCTCGTAGT CCTACCACCC ISKCCACCAC CTGIACCTTT GGAGACCTCG CTCGACTGTT 

10930 10940 10950 10960 10970 10980 
GACAGGAGCG CACGACGGGT AGGCGGCCCA TATGAGCGTC TACCCGGCGA AGCATTCTGA 
CTGTCCTCGC GTGCTGCCCA TCCGCCGGGT ATACTCGCAG ATGGGCCGCT TCGTAAGACT 



10990 11000 

TCACCTTGCA ATCTCTAGTA 
AGTGGAACGT TAGAGATCAT 

11050 11060 

GGTTACCGGA TCTTATTGCC 
CCAATGGCCT A6AATAACGG 

11110 11120 
AGGTCGGCAA AATTCGTCTC 
TCCAGCCGTT TTAAGCAGAG 

11170 11180 

AGGCCGCACC CATGTTAGAC 
TCCGGCGTGG GTACAATCTG 

11230 11240 

TCAGAGCTGC GGTTGGTGTC 
AGTCTCGACG CCAACCACAG 

11290 11300 

AGGC6CAAAC CGTGAAGAGC 
TCCGCGTTTG GCACTTCTCG 

11350 11360 

CGAAACCGAA AACTAAAACG 
GCTTTGGCTT TTGATTTTGC 

11410 11420 

CGCTCGCCGA AGCGCGCC6T 
GCGAGCGGCT TCGCGCGGCA 

11470 11480 

GCGCAGGTCC G6TCGGASAG 
CGCGTCCAGG OCAGCCtCTC 

11530 11540 

GCATAACTGT CAGGCGTTGA 
CGTATTGACA GTCCGCAACT 

11590 11600 

tcgaagcgac gcctgacgcg 

AGCTTCGCTG CGGACTGCGC 



11010 11020 
ACTAGAGGTT CAAGCGTCGG 
TGATCTCCAA GTTGGCAGCC 

11070 11080 

AAGCGTTGGA GGCTGTCATC 
TTCGCAACCT CCGACAGTAG 

11130 11140 

TTGACGGCTG CTCCTICCGT 
AACTGCC6AC GA6GAAGGCA 

11190 11200 

CGTCGACAGG CTAAATACGG 
GCAGCTGTCC GATTTATGCC 

11250 11260 

GCATCGGTCT TG C TGTT C TT 
CGTA6CCAGA ACGACAAGAA 

11310 11320 

G6GGC6TCAC GAGCTCAAGA 
CCCCGCAGTG CTCGAGTTCT 

11370 11380 

ACGCGCAAGC AAAGGGCTGC 
TGCGCGTTCG TTTCCCGACG 

11430 11440 

CCACG6ATTT GCAAGACGCG 
G6TGCCTAAA CGTTCTGCGC 

11490 11500 

CA6TGCTC6T GCTGiGTCGAA 
GTCACGAGCA CGACCAGCTT 

U550 11560 

CCGCCCGCGA CCTTCGCGCG 
G6CGGGCGCT G0AGCGCGC 

11610 11620 
ATAGAAATCA CGGGtCGCCT 
i^TCTTTAGT GCCCAGCGGA 
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11030 11040 

ACCTGTCCGA CTTTCGTCGT 
TGGACAGGCT GAAAGCAGCA 

11090 11100 

GTCGCCCCCG CCGTGTCGGA 
CAGCGGGGGC GGCACAGCCT 

11150 11160 

CGAGCGATTG CATAGGCAGG 
GCTCGCTAAC GTATCCGTCC 

11210 11220 
GTGAACCTTG AAGAATACTC 
CACTTGGAAC TTCTTATGAG 

11270 11280 

GTCATCAG6T GTGGCGGGGC 
CAGTAGTCCA CACCGCCCCG 

11330 . 11340 

AACGACGACC ACCCAGAAGG 
TTGCTGCTGG TGGGTCTTCC 

11390 11400 

GGATGAAGCC AAGGCCAl^ 
CCIACTTCGG TTCCGGTTCC 

11450 11460 

G6A6AGCGAA TGCAGCTATG 
CCTCTCGCXT ACGTCGATAC 

11510 11520 

A3CCGGT6CG CCTGATCTTG 
TAGGCCACGC GGACZAGAAC 

11570 11580 

GGCAGGCAA6 C6IGCGTCGC 
CCGTCCGTTC GCACGCAGCG 

11630 11640 

ggttcgttct gaaagcttgg 

CCAAGCAASA CTITC6AACC 
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11650 11660 11S70 

GATTGGGTTT AGGTGATGGft ASCCGGCGTT 
CTAACCCAAA TOACTACCI, TCGGCCGCAA 

11710 11720 11730 

AGCGCGCTCC AGTTTSCRAC CCGAGCACAC 
TCGCGCGAGG TCAAACGTTG GGCTCGT6T6 

11770 11780 11790 

CCCTATATC6 TTCATCCGAT TGCGGTGGCG 
GGGATATAGC AAGIAGGCTA ACGCCACCGC 

11830 11840 11850 

GAAATGATCG CCGCAGCGCT GCITCACGAT 
CTTTACTAGC GGCGTCGCGA C6AAGTGCTA 

11890 11900 119i0 

GAGATCAAGG AAGCGTTCGG CCCCAAGGTC 
CTCTAGTTCC TTCGCAAGCC GGGGTTCCA6 

11950 11960 11970 

TCCACTCCGT TCCACGGCAA CCGACAGGTG 
AGGTGAGGCA AGGTGCCGTT , GfeCTGTCCAC 

12010 12020 12030 
TCGGCGCCCG CCGCGGCGAA AACCGTCAAG 
AGCCGCGGGC GGCGCCGCTT ITCGCAGTIC 

12070 12080 12090 

ATCARAGCCG GCGATCCGAA TTT C TGGAAA 
TAGTTTCGGC CGCTAGGCTT AAAGACCtTT 

12130 12140 12150 

GAGGTCTTGG GCGACGGCGA C6AGACCCTT 
CTCCAGAAeC CGCTGCCGCT GCTCTGGGAA 

12190 12200 ^ 12210 

T6A6AGTGCC GCCGTTTATC ' GGCM^GCATG 
ACTCTCACGG CGGCAAATAG OCGTTCGTAC 

12250 12260 12270 

ATCCAAGATC GCAGAACGGA dATGCATTTG 
TAG6TTCIA6 CGTCTTGCCT GIACGIAAAC 

12310 12320 12330 

gcctcacagg ctgcgcggtt gcggccgtta 

CG6AGTGTCC GACGCGCCAA CGCCGGCAAT 

12370 12380 12390 

GCCTCAATGC CCCAGCCASA TCCGCAAGGG 
CG6AGTXAC6 GGGTCGGTCT A^GTTCCC 

12430 12440 \ 12450 

6AGCGCGATC 6AGAC6ATGA CGAGCAGCGG 
CTCGCGCIAG CTCTGCTACT qeiCGTCGCC 

12490 12500 L 12510 

AIAGCGCGAG CC6ACCTGGG OGCGGAGGAA 
TAICGCGCTC GGCTGGACCC GCGGCICCTT 

12550 12560=; ’ 12570 

CCAGAGAACG GCGCCGAAGA' AGAGGKAGAC 
GGTCTCTTGC CGCGGCTTCT :^CTTCTG 



123 /rx I 

11680 11690 11700 

GAACGCAAAA IAAT6ATCGA TCTCGAGAAC 
CTTGCGTTTT ATTACTAGCT AGAGCTCTTG 

11740 11750 11760 

GGCGAACAGA AGCGTAAGTA TGACGGTCGG 
CCGCTTGTCr TCGCATTCAT ACTGCCAGCC 

11800 11810 11820 
GAGATTGTTC GAAGCGTGCC CCATACGCCC 
CTCIAACAAG CTTCGCACGG GGTATGCGGG 

11860 11870 11880 

ACGGTCGAAG ATACCGACGC GAC6CT6CT6 
OGCCAGCTTC TATGGCTGCG CTGCGACGAC 

11920 11930 11940 

GC^CACTGG TTGCGTGGCT CACCGACATA 
CGTTGTGACC AACGCACCGA GTGGCTGTAT 

11980 11990 12000 

CGCAAGGAAC TGGATCGCCA GCACCTCGCA 
GCGTTCCTTG ACCTAGCGGT CGTGGAGCGT 

12040 12050 12060 

CTC6CCGACC TGATCGACAA TGCGAIA6C6 
GAbqGGCTGG ACTAGCTGTT ACGCTATCGC 

! 12100 12110 12120 

GTGTTCGGCG CC6AGATGAA ACGCTTGCTG 
CACAAGCCGC GGCTCTACTT TGCGAACGAC 

12160 12170 12180 

CTCGCAAAGG CCCGTGCATT AGCGCCGGAA 
GiAC^GTTTCC GGGCACGTAA TCGCGGCCTT 

12220 12230 12240 

TCTGTGCCAT 6TCGACCCGG TCAACC6GTC 
AGACAC6GXA CAGCTGGGCC AGTTGGCCA6 

^280 12290 12300 

CGGTTTTGCC CGCC6GT6T6 6CCCAGCCAC 
GCCAAAACGG GCGGCCACAC CGGGTCGGTG 

12340 i 12350 12360 

ggaoigcgca gaaittgccg accgcgccgc 

CCTGTCGCGT CTTAAACGGC TGGCGCGGCG 

■ ' ' ' 

'^^12400 12410 12420 

AXGCGTCGGA TCTGCGAGCA GCCGGATCGC 
TACOCAGCCI AGACGCTC6T CGGCCTAGCG 

12460 12470 12480 

CTTGAT6ATC TTGGCGCCCT TGGCCATGGC 
GAACTACIAG AACCSCG6GA ACCGGZACCG 

12520 12530 12540 

CTGGCCGAGG CCCATCAACA GGCCGACCTT 
GACCGGCTCC GGGIAGTT6T CCGGCTGGAA 

12580 12590 12600 

GC CSftA GGCG CCGACGTTGG AGCCAAAGTT 
cggcitccgc GGCTGCAACC TCGGTTTCAA 
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12S10 12620 12630 12640 12650 12660 
6AG6AACTTC GTGTGCGCCG TCGCCTTCAA CACGCCGAAG CCGGCGAGGG T3ACGAAGCC 
CTCCTTGAAG CACACGOGGC, AGCGOAGlf GTGCGGCTTC GGCCGCTCCC ATTGCTTCGG 

12670 12680 12690 12700 12710 12720 
GAGCAT6AAG AACGAGCCGG TGCCGGGGCC GAAGACGCCG TCATAAAAGC CGATTAGCGG 
CTCGXACTXC TTGCTCGGCC ACGGCCCCGG CTT(H?^GGC AGXATTTTCG GCTAATCGCC 

12730 12740 12750 12760 12770 12780 
CACCAGTGTC AGCGT6AAGA CGAAGGGGGT GACGCGGCTG TGCTGGTCGA CGTCGCCCAT 

6TGGTCACA6 TCGCACTTCT -OCITCCCCCA CTGCiXCGAC ACGACCAGCT GCAGCGGGTA 

' ■ 

12790 12800 12810 12820 12830 12840 
GTTCGGCTTC AGGCCGAAAT AAAGCGCAAT GGCGATCAGC AGAAAGGGCA GGATCGCCTT 
CAAGCCGAAG TCCGGCTTTA TTTCGCGTXA CCGCXA6TC6 TCTTTCCCGT CCTAGCGGAA 

12850 12860 12870 12880 12890 12900 
CAGCACGTCG CCGGGAACGA TGGTTGCGAG CAGGGCGCCG AGCACGGCGC CGGCGGCCGA 
GTCGTGCAGC GGCCCTTGCT ACCAACGCTC GTCCCGCGGC TCGTGCCGCG GCCGCCGGCT 

12910 12920 12930 12940 12950 12960 
CATCAGCGCC ATCGGCAGCT GCTCTTTCA6 GTTCACGTGG CCGCGCCGGG CATAGGACAG 
GTAGTCGCGG TAGCCGTCGA CGAGAAAGTC CAAGTGCACC GGCGCGGCCC GTATCCTGTC 

12970 12980 12990 13000 13010 13020 
CGTGGCCGAG CCGGAGCCGA A(vAATCCCTG CAGCTTGTTG GTGCCGAGC6 TCTGCAAGGG 
GCACCGGCTC GGCCTCGGCT TGITAGGGAC GTCt^CAAC CACGGCTCGC AGACGTTCCC 

13030 13040 13050 13060 13070 13080 
CGGGATGCCC GCAATGAGCA TGGCCGGAAT GGTGATCATG CCACCGCCGC CGGCGATCGA 
GCCCTACGGG CGTTACTCGT ACCGGCCTTA CCACXAGTAC G6TGGCGGC6 GCCGCTAGCT 

13090 13100 13110 13120 13130 13140 
ATCGATGAAG CCTGCGATGA AGGCGGCGAC GAACAGGAAG GCGAGCAGGT GGAAGGCGAG 
TAGCXACTTC GGACGCTACT T0CGCCGCTG CTTGTCCTTC CGCTCGTCCA CCTTCCGCTC 



ATCT 

TAGA 

FIGURE 43.13 
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Carte de restriction de la sequence de 13144 pb 
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Sequence de 1 3 Ml pb 



de 



130 

4?9 a , 1886 g6ne eob(^ 



«TRR I tILQG TGSD H GKSULU.RGLCR 

flTGflCflC6CRGGRTCflTGTTGCRGGGRfl|$GGCTCGGRTGTCGGRflflRTC6GTflTTGGTG6CG6GGCTCTGCCG6 

^29 439 M9 mr 469 479 489 499 

L fl fl M 0 6 L K U R P F k P 0 H n S H N ft fl U S D 

^^^^^^^^^•'^^^^•'^^CCTCflfiGGTCCGGtC&TTCnRGCGGCflGftnCflTGTCGnflCflfiCGCCGCCGTTTCCGnC 

5®^ 514 524 534 - 544 554 564 574 

I CRR QU LQRLRRRUPSSUHnN 
6flCGeC6GCGflGflTCGGCC6CGC3CflffTGGCTGCflG6C6CTGGCCGCGCGCGTGCC6TCGTCGGTGCRCRTGflfiC 

529 589 599 609 619 629 639 649 

PULLKPQ SDU C SQ IUUQGKURGORR 

CCGGTGCTCCTGflflGCCGCRGTCGGflCGTGGGCRGCCflCflTCGTCGTTCflGGGCflflGGTCGCCGGGCflGGCCflGG 

554 664 674 664 694 704 714 724 

5 « E V <J fi L K P l L G fl u n E S F E q I S R G 

®*’®^*’®.Pil**^^^^*’®®5®*'2®®.?®®®®®flfiC2GCTGGGCGCCGTCflTGGflGflGTTTCGflflCflflflTflTCGGCCGGT 

229 739 t49 759 769 779 789 799 

"“'-UUUEG fl GS PflE I HLRPGO I A HH 

GCCGflTCTCGTGGTGGTCGflflGGCGCCGGttCGCCGGCCGflflflTCflflCCTCflGGCCCGGCGBCflTCGCCflfiTfiTG 

5®^ 824 834 844 854 864 874 

OFRTRRH UP U OLU GD I 0R6GU I RSL 

GGCTTTGCGRCRCGGGCCRnTGTGCCGGTCGTGCTGCTCGGCGRCRTCGRCCGCGGGGCGGTGRTCGCCTCGCTG 

829 889 899 909 9I9“ 929 939 04Q 

®®2HR I L PE E DRR nUTGVL I HKFRG 
CTCGeCflCGCflTGCGflTCCTGCCCGflGGflRGflCCGGCGCflTGGTGflCCGGCTflTCTCflTCflnCRRGTTCCGCGGC 

954 964 974 984 994 1004 1014 1024 

0 U T L F D D G I R R U H R V T G U P C F G U U P 

®®^®2CfiCGCTGTTCGflCGRCGGCflTTGCTGCCGTCRRCCGCTflCRCCGGCTGGCCCTGCTTCGGCGTCGTGCCG 

1029 1039 1049 1059 - 1069 J 1079 1089 1099 

®LKRRRRLPflE: DSU U’ LEKLTRCEGR 
TG6CT6RflGGCG6C6GCRCGCCT6CCGGC6iGRR6flTTCC6TC6TGCTGGAfiRAfiCTfinrRrRrnnri:ai: 



« vww , WW4.UU I nu I vpvoi-n I Luutnn 1 1 i COnuiiHCCTC6flTCCCCTC6CCGCC6flflCCC 

•'29 1189 1199 1209 1219 1229 1239 1249 

5 • OLUFURPGSP, I PUDRGL UU 1 PGS 

GRGRTTGRTCTCGTCTKGTGCGGCCTGGCRGTOCCRTTCCbGTCGRCGCTGGCCTCGTCGTCRTTCCCGGGTCG 

y c ‘294 1304 1314 1324 

K ST I 6DL I DF R flQG U DRDLE.RHURR 

it-ta ‘“^‘‘^^.‘*®‘^®®2CG6CGRCCTCflTC6flTTTCCGTGC6Cflfi0G6T6GGflCC6TGflCCTCGRflCGTCBTGTGCGCCCG 

•529 1339 1349 1359 1369 1379 1389 1399 

” U I 0 I C G G V 0 n U G R R 0 T 0 P L G I E 

®*’‘^®®5^®®®2CflTCGGCflTCTGCGGCGGCTRCCRGRTGCTCGGCCGGCGCGTCRCCGRTCCGCTCGGCRTCGRG 

'^®^ ‘«4 1434 1444 1454 1464 1474 

® G 5 n fi U E G L G L L E 0 E T E 11 R P E K T 3 R 

GGCGGCGflRCGTGCGGTCGRGGGCCTCGGGCTGCTCGflGGTCGRGRCCGRGRTGGCGCCGGRflRRGRCGGTGCGC 

‘^29 1489 1499 1509 V 1519 ; 1529 1539 1S« 

M S R R U S L E « D U U L E 6 V E I H LG K T O G 

<ee^ GflCflGCCGCGCCTGGTCGCTGGRGCRTGflTGTGGTGCTCGflRGGCTRCGRRRTCCRTCTTGGCflRGRCGCRRGCT 

^®24 1584 1594 1604 1614 1624 

ROCGRPSUR I ONR ff DGRLSROGRUn 
<««« ®GG6flCTGT6GCCG6CCGTCGGTGC6CRTCGflCRflTC6C6CC6flCGGC6CCCTTTCGGCC6RTGGCCGCGT6RT6 

‘829 1639 1649 1659 1669 1679 1689 1699 

6 2 V L H G L F T S D R V R 6 R L L K S F G I E G 

GGCflCCTflCCTGCflTGGGCTCTTCflCCflGCGflCGCCTRTCGCGGCGCGCTGCTCRRGRGTTTCGGCflTCGRflGGC 

‘2®4 1714 1724 1734 1744 1754 1764 1774 

gg^nvrqsud R RLDDURNELERULD 
GGCGCCRRCRRCTRCCGCCflRTCGGTCGflXGCGGCGCTCGflCGRTGTCGCGRRCGRflCTGGRGGCTGTGCTCGRT 

« ‘2®® ‘2®® 1809 1819 1829 1839 1849 



1854 



1809 

R R U L D E L L R H > 
CGTCGCTGGCTGGRCGRGTTGCTCRGGCBCTRG 
1864 1874 1864 
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Sequence de I3H4 pb de ^64 o 3888 gine eobP 

HSSLSflGPULULCGfl RSGKSSFSER 
RTGRGCRGTCTCRGCGCCGGGCCCGTGCTGGTCCTTGGCGGCGCCCGTTCCGGCHRGTCCRGCTTTTCCGRGRCG 

3364 3374 3384 3394 3404 3414 3424 3434 

LWERSGFTHHV GRTGRRUOOEnRER 
CTCGTCGRRGCGTCCGGCTTCRCCRTGCRTTRTGTCOCCflCGGOCCGCGCCTGGGRCGRCGRRRTGCGCGflGCGC 

3439 3449 3459 3469 3479;t 3489 3499 3509 

I DHHRTRRGE G UTT HEEPLOLUG I L 
RTCGRCCRTCflCCGGRCGCGCCGCGGCGRGGGCTGGRCGRCGCRTGRGGRGCCGCTCGflTCTCGTCGGCRTCCTC 

3514 3524 3534 3544 3554 3564 3574 3584 

RRIODPSHUULIDCLTLUUTHLtILE 

RGflCGCRTCGRTGRTCCCRGCCRTGTGGTCCTGRTCGRCTGCCTGRCGCTRTGGGTCRCCflflTCTCRTGCTGGRfl 

3589 3599 3609 3619 3629 3639 3649 3659 

ERDtlTR.EFR R L URVLPERRRH LUFU 
GRGCGCGRCRTGRCGGCGGRGTTCGCCGCCCTTGTTGCGTRTCTGCCCGRGGCGCGGGCGCGCCTCGTCTTTGTT 

3664 3674 3684 3694 3704 3714 3724 3734 

SHEUGL G I UPEHRnRREFR OHRGRL 
TCCflflTGRGGTCGGCCTCGGCflTCGTCCCCCflGRBCCGCflTGGCCCGCGRGTTTCGCGflCCflTGCCCGCCGGCTT 

3739 3749 3759 3769 3779 3789 3799 3809 

HO lUREKSREO'VFU R RGL PLKnKG* 
CRCCRGRTCGTTGCGGRCRflflTCCGCTGRRGTTTflCTTTGTCGCGCCCGGTTTGCCGCTGRRRflTGRflGGGTTGfl 

3814 3824 3834 3844 3854 3864 3874 3884 
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134/i^ 

Sequence de 13M4 pb de 3S92 a 4956 gbne eohU 

HTTflRflHOGKIPflTUITGFLGfiGKT 

flTeflCCHCTGCGBGRGCCflflCCBGGGCfifteftTCeCGGCGflCCGTCflTCflCCGGCTTCCTCGGCGCCGGCflflCflCG 

3092 3902 3912 3922 3932 3942 3952 3962 

TntRHLLOHROG K BIGLI IHEFGDL 
RCGRTGRTCCGCRRCCTGCTGCRGRRCGCCGflCGGCRRGCGCRTCGGCCTGRTCRTCflflCGRGTTCGGCGRTCTT 

3967 3977 3987 3997 4007 4017 4027 4037 

GUDGDULKGCGRERC TEOOI lELTH 
GGCGTCGRCGGCGRTGTCTTGRRGGGCTGCQGTGCCGflGGCCTGCRCCGRGGRCGRCRTCRTCGRGCTCflCCRRT 

4042 4052 4062 4072 4002 4092 4102 4112 

6 C I C C T U R D D. F, IPTllTKLLE REHRP 

GGCTGCRTCTGCTGCRCCGTGGCTGRCGRTTTCRTCCCGRCCRTGflCGRRGCTGCTCGRGCGTGflflRflCCGTCCT 

^117 4127 4137 4147 4157 4167 4177 4187 

I • I E.TS GLRLPQPL 1 RRFHUPD I 

GflCCflCflTCflTCRTCGRRRCCTCGGGCCTTG^CCTGCCGCROCCGCTGflTCGCCGCTTTCRRCTCGCCGGflTflTC 

4192 4202 4212 4222 4232 4242 4252 4262 

RSEUTUDGU U' T U UDSflft URRGRFRD 
CGCRGCGflflGTGflCCGTCGRTGGCGTCGTORCCGTGGTCGRCflGCGCCGCCGTTGCCGCTGGCCGCTTTGCCGflC 

4267 4277 4287 4297 4307 4317 4327 4337 

DHDKUDRLR UE^DDNLDHESP I EELF 
GflCCflCGflCflflGGTCGflTGCGCTGCGCGTCGflGGflCGflCflRTCTCGflTCRCGflflflGCCCGRTCGfiGGflGCTGTTC 

4342 4352 4362 4372 4382 4392 4402 4412 

EDQLT RRDL 1 O L HKTOL 1 DflSGLKfl 
GflGGflTCRRCTGRCGGCTGCCGflTCTCRTCGTTCTCflflCRRGRCCGRTCTGflTCGRTGCCTCCGGCCTCflflGGCC 

4427 4437 4447 ^ . 4457 4467 4477 4487 

'’•'deussrts r k Pin I erkngeurr 
GTGCGCGRCG flGGTGTCTTCGCGCRCCflGCCGCflflGCCCflCGRTGRTCGRGGCGRRRRflCGGCGRRGTCGCCGCT 

4492 4502 4512 4522 4532 4542 4552 4562 

R • LLG L6UGT E‘SD I R NRKSHHEriEH 

GCCRTCCTGCTTGGCCTCGGTGTCGGCflCGGRRRGCGRTRTCGCCflRCCGCRRGTCGCRTCflCGRGflTCGRCCflC 

4567 4577 4587 4597 4607 4617 4627 4637 

ERGEEHDHDE F. DSFOUELGSIRDPR 
GRGGCRGGTGRGGRGCRCGRTCRCGRCGRGTtCGRCRGCTTCGTCGTCGRGCTCGGTTCGRTCGCCGRTCCGGCC 

4642 4652 4662 4672- 4682 4692 4702 4712 

RP I OR LKG U I R.EH DULR LKGFRDUP 

GCCTTCRTCGRTCGCCTGRRGGGCGTRRTCGCGGRGCRCGRCGTTCTGCGCCTCRRGGGTTTTGCRGRCGTGCCC 

4717 .4727 4737 4747 4757 4767 4777 4787 

6KPI1RLL 1 QRU GRR t OQVVDRRUGR 
GGCflflGCCGflTGCGCCTCCTGRTCCRGGCGGTCGGCGCCCGCflTCGflCCRRTflTTRCGHCCGCGCCTGGGGCGCT 

4792 4802 4812 4822 4032 4842 4852 4862 

GEKRGTR LOO I GLHD RDERRURRR I 
GGCGRRRRGCGCGGTRCGCGCCTCGTCGTCRtCGGCCTGCRCGRCRTGGRCGRGGCGGCGGTGCGCGCCGCGRTC 

4867 4877 4807 4097 ■ 4907 4917 4927 4937 

T R L U • 

flCCGCGCTCGTGTRG 

4942 4952 
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Sequence de 13144 pb de 5060 o 8887 gbne eobH 

nHLLLflQICGTI./RD 0 NEflIDLGQTPfl 
RTGCRTCTGCTTCTCGCCCRGflRflGGRRCGGTCGCCGflCGGCRflCGRGGCGflTCGflCCTTGGGCnflflCGCCGGCC 

5060 5070 5080 5090 5100 5110 5120 5130 

0 I LFLSRR O TE LSS I RRRHGRRDGG 
GRTRTCCTTTTCCTRTCGGCCGCCGRCflCCGRGCTCTCCTCGRTCGCCOCGGCTCRCGGCCGRCGCCRCGGflGGC 

5135 5145 5155 5165' 5175 5185 5195 5205 

LSLR I flSLnSL n-H Pn SUDTVUERTfl 
TTGRGCCTGCGCflTCGCCflGCCTGRTGRGCCtGRTGCfllfcCGflTGTCGGTCGRCflCTTflCGTCGflGCGCflCGGCG 

5210 5220 5230 5240 5250 5260 5270 5280 

RHRKLI UURP t GG RS VFRVLLERLH 

CGTCRCGCCRRGCTGRTCGTCGTCCGGCCGCTCGGTGGCGCCRGCTRTTTCCGTTRTCTGCTGGRRGCCCTGCRT 
5285 5295 5305 5315 5325 5335 5345 5355 

fl fl R U T H R F E l »; U L P G O 0 K P 0 P G L E P 

GCGGCTGCCGTCRCCCRTCGTTTCGRGRTCIBCGGTTCTGCCGGGTGflCGRCRRGCCGGRTCCGGGGCTGGRGCCT 

5360 5370 5380 5390: 5400 5410 5420 5430 

fsturrodhorlurvftecgsdhrg 

TTCTCCRCCGTCGCRGCCGflCGfiCCGCCRGCGCCTTTGGGCTTRGTTCflCCGRRGGCGGCTCGGRCflRTGCCGGG 

5435 5445 5455 5465 5475 5485 5495 5505 

LFLDVRRRLOTG R E K PQPRKPLLKfl 

CTGTTTCTCGRCTRTGCGGCCGCRCTGGTCRCRGGTGCGGRGRAGCCGCRGCCGGCRRflGCCCCTGTTGRRGGCC 
5510 5520 5530 5540 . 55^, ■ 5560 5570 5580 

GIUUPCRG UI G U S E Uj, QSLUQGRtlUR 

GGCRTCTGGTGGCCGGGTGCTGGtGTGRTCGGCGTCRGCGRRT^GCRGTCCCTTGTTCflGGGRCGGflTGGTRGCG 

5585 5595 5605 56t5 , 5625 5635 5645 5655 

GEGFEPPT O G' 'lI' C F V R R L 0 Q S 6 E T R P 

RGGGRGGGRTTCGRRCCCCCGRCGGTGGGGRTCtGCTTTTflCCGCGCCCTCGTGCRGRGTGGCGRGRCRCGGCCT 

5660 5670 5680 5690 > 5700 5710 5720 5730 

WEfiL I ORLE R E GUR R LPO FOSSLICD 

GTGGRGGCGCTGRTCGRTGCGCTGGRGGCTGRRGGTGTGCGGGGflCTGCCGGTGTTTGTCTCRflGCCTCRflGGRT 
5735 5745 5755 5765 5775 5785 5795 5805 

RUSUGTLQfll F ■ S E - fi, ' fl P D 0 0 It H R T G F 

GCCGTTTCCGTCGGCRCGCTGCRGGCGRTttTTTCCGRGGCCGCflCCCGRCGTGGTGRTGRRCGCCRCTGGCTTT 
5810 5820 5830 5840‘- 5850- 5860 5870 5880 

fl 0 S S P G fl D R Q P T O L E S T G fl P 0 L Q 0 I 

GCGGTCTCGTCGCCCGGTGCCGflCCGTCAGCCGRCGGTGCTGGflflTCGRCCGGTGCGCCGGTGCTGCRGGTGRTT 
5885 5895 5905 5915 5925 "5935 5945 5955 

FSGSSRflQU E I S P Q G L tlRROLRIINO 

TTCTCCGGCTCGTCGCGGGCGCflRTGGGflflRCGTCGCCGCRGGGGCTGATGGCGCGCGflCCTCGCCflTGRflCGTG 
5960 5970 5980 5990 6000 \ 6010 6020 6030 

ALPEODGR IL 9 R fl Oi SFK RRSlVDfllC 

GCRCTCCCCGARGTCGRTGGCCGCRtCCTTGCGCOCGCC^tCTCCTTCflflGGCGGCGTCGRTCTflTGflCGCCRRG 
6035 6045 6055 6065 6075/' 6085 6095 6105 

WERH I UG HE PL EGR, U RF flflOLROHU 
GTGGflGGCCflRTftTCGTCGGCCflTGRGCCGdTCGflflGGCCGGGTGCGCTTTGCCGCTGflTCTTGCCGTCRRCTGG 
GUG 6120 6130 6140 6150 6160 6170 6180 

RNURRREPfl E; R R I fl/ l UlIRNV PHRDG 

GCGflflCGTGCGCCGGGCflGflGCCCGCCGflGCGCCGTflTTGOCflTCGTCflTGGCCflflCTRTCCGflflCCGCGflCGGT 
6185 6195 6205 6215 6225 6235 6245 6255 

R L G H G U G L ‘/jp I, P R G T U E U L S R 11 R R E G 

CGCCTCGGCRRCGGTGTCGGGCTOGflfORCGCCGGCCGG.TR'CCGTCGRGGTGCTTflGCGCCRTGGCGCGGGRflGGC 
6260 6270 6280 ,6290/. 6300' 6310 6320 6330 

V fl G 6 E U P fl 0 G fl L I R FLtlRGPTHRR 

TflTGCGGTCGGTGRGGTTCCCGtCORTGGCOflCGCGCTGflttCCGCTTTCTGflTGGCCGGGCCGflCCflflTGCGGCG 

6335 6345 6355 6365 / : 6375 " 6385 6395 6405 

S H D R E I R E H 1 Si.; L H Df y/ KIFFDSLPICQ 

flGCCflTGflCCGTGflflRTCCGCGR^CGTflTTTCGCTGflRCGflttRCRflflflCGTTCTTCGflTTCGCTTCCGflflflCRG 
0^10 6420 6430 6440/ : 6450 ^ 6460 6470 6480 

• K D E U fl G R U G U P E HOP F F L 0 G A F fl L 

flTRRflGGflTGRnGTTGCCGGTCGCTGGGGCGTGCCGGRGGCCQ^CCCTTTTTCCTCG^TGGCGCCTTCGCGCTG 
6485 6495 6505 6515 6525 6535 6545 6555 
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P L fl n F G E U 1 U & I Q p a R 



V H I D P K E S 



6560 6570 6580 6SGQ 6600 

VHSPOLUPPH G VL fl 



6610 6620 6630 

TflCCRTTCCCCGCflCCTCGTGCCGCCGCflTGCCTflTCtCGCCTTCTflCGCCTTCCTGCCCCflCCflGTKOGflGCG 

6635 6615 6655 r666^i: 6675 6685 6695 6705 

Q fl I U H n G K H L E U L P G K fl L R L S E T 



6860 



6730 671G 6tS0 6760 ‘ 6770 6780 

C V P E fl I F B ,P L P H I V’P F I O H D P 0 E G T 

^®‘^T'll<i5J^®‘‘‘’‘5CGflTCTTCGG6CCGCT6CCGCflCflTCTflTC0CTTCflTCGTCflflC6flTCCGGGCGflflGGTflC6 

6785 6795 6805 6815 6825 6835 6815 6855 

^ " T S fl 0, I, I O HLT PPLTRflESVG 

CflGGCCflRGCGCCGCRCCAGCGCCGTDRtCRJCGRCCflCCTGRCCCCGCCCTTGBCGCGCGCCGARTCCTACGGC 

6870 6880 6890 6900 6910 6920 6930 

P L K D L E R L U D'E V V & R R G G 0 P R R L R L 

‘^‘^®‘^^‘^f’**®<><>TCT6GflflGC6CTCGTCGflCGflnTflTTflCGneGCCGCCG6CGGTGflTCCGC6CCGCCTCflGGCTG 

6935 6915 6955 6965' 6975 6985 6995 7005 

LSRO I LDLU R DI GLDSDflG I DRGDS 
•»nin ^^^*'®^j'®^^**®^^^‘'^^®**TCTCGTGCGC5flCflTCGGCCTCGflCflGCGflCGCflGGCflTCGflCflGGGGCGflCflGC 
7010 7020 7030 7010 7050 7060 7070 7080 

OOKflLElC LDfl. V LCO L ICEn Q I RDGLH 
GflCGflCflflGGCGCTGGflflflflGCTCGflCGCCTflTCTCTGCGflCCTCflflGGflflflTGCflGflTCCGCGflCGGCCTGCflC 

. r ^’25 7135 7115 7155 

I FGURPEGRL L T D LTUflL flRUPRGL 
’’'^‘^TT5.l®‘^®^^®‘^®®‘^®°'’‘’®®®^<5‘5TTG|TGflCGGflCCTCflCCGTflGCGCTG6C6CGC6TGCCCCGflGCTCTC 

7160 7170 7180 7190. 7200 7210 7220 7230 

6 E G G 0 0 S L 0 R fl I fl fl 0 fl G L fl G F fl I P T 

GGCGflGGGCCGCGflCCflGftGCCTGCflGCGGGCGflTCGCflGCGGflTGCGGGGCTGCGTGGGTTTGCTflTTCCCflCC 

7235 7215 7255 7265 7275 7285 7295 7305 

S fl G G H P fl R 0 fl g P F 0 P L D C 0 H S 0 T U T 

TCGGCGGGGOGCflflCCCCGCflCGCGftCGCCCflflCCCTTCGflCCCGCTCGflCTGCGTCflTGTCCGflCflCCTGGflCfl 

^ ^350 7360 7370 7380 

O P K P S I L fl O L S O fl P U BTflGDTUERI 

CRCCCGflflflCCGTCCflTCCTCGCTGflCCTCTCGGftCGCCtCCTGCCGCflCCGCCGGCGflTflCGOTCGflGCGCflTC 

7385 ^ 7395 7105 7115 v; 7125 7135 



7085 



7310 



7115 



7155 



7160 



L L fl fl H L U S G E L fl C P 0 H Ufl H T R fl U L 

GflGTTGCTTGCCGCflflflTCTCGTGTCGGGTGflflCTGGCTTGCCCGGflCCflCTGGGCCflflCflCCCGCGCCGTGCTC 



7535 



7170 7180 7190 7500 7510 7520 7530 

0 E I E T R L K P S I S H S G fl fl E fl T G F L T G 

GGCGflflATCGflRRCGCGCCTGRRGCCGTCGflTTTCRRRCTCGGGTGCCGCCGRGflTGflCCGGCTTCCTCflCCGGT 

7515 7555 7565 7575 7585 7595 7605 

L S G fl F U fl P G P S G fl P T fl G R P 0 U L P T G 

OTCflGCGGCCGCTTCGTCGCCCCCGGtCCflTCGGGCGCGCCGflCGCGCGGCCGGCCGGflTGTGTTGCCGflCGGGG 

u !“®. ^®50 7660 7670 7680 

fl HFVSUOS Rfl O PT PflflVELCKKSflE 
®®®®®J7.P^®®^®®®^®®®®®®®®®^8^‘?87GCCGflC6CCGGCGGCTTflCGflGCTT6GCflfl6flflflTC6GCC6RG 
7685 7695 7705 7715 7725 7735 7715 77SS 

* RRVLO DH O EIIPSSF GL TRUGT fl 
CTTCTGflTCCGCCGCTflCCTGCflGGflCCflTGGCGflflTGGCCGTCCTCCTTTCGCCTGflCCOCCTGGGCCflCGGCG 

7760 7770 7780 7790 7800 i, 7810 

N II R T G G 0 0 . I fl^ 0 fl , L ' jilR L I G A 



7820 7830 

1C P T U 0 n 0 



7835 



7815 7855 

R R U n G V E 



7910 



7985 



8060 



7865 .. 7885 7895 7905 

I U P L ft ' Of'-L. GRPRUOUTLR 

TCTCGCCGGGTGRTGGGCTflCGflGATCGTGCCGCTCGCRGTCCTCGGCCGCCCflCGCCTCGACGTCflCCTTGCGC 

. . . .’®^® 7950. 7960 7970 7980 

I SGFFRDR.FPDQ I fl LFDK fl | RflUflL 

ATTTCCGGCTTCTTCCGCGflTGCCTTCCCGGflCCRGRTCGGGGTOTTCGACRRGGCGflTCCGCGCCGTCGCGCTC 

W95 8005 8Qltr5 8025 0035 8015 0055 

E E D 0 fl D N H I fl fl R_H R fl E S R R L E fl E G U 

GflGGRRGflCGflTGCCGflCflRCflTGATCGCCGCflCGCflTGCGGGCGGflflflGCCCGCGGCTGGflGGCCGAflGGCGTG 

8070 8080 8090 8100 ■ 8110 



8120 



8130 
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EfiflEflflRRRSV BU FG'flIC PGflVGnflL 
GflflGCCGCCGRGGCCGCGCGTCGCGCCTCetRCCGCGTCTTTGGCGCRftflGCCCGGTGCCTflTGGCGCCGCCCTG 

®> 3 S 8 M 5 8155 8165 8175 8185 8195 8205 

’ ®^ l^®UEt i:flD L REflVLTUGflV 
CRGGCGCTGRTCGftCGRGRRGGGCTGGGRfl^CRRflGCflGflTCTCGCCGflGGCCTflTCTTRCCTGGGGCGCCTflT 

8210 8220 8230 8210 . 8250 8260 8270 8280 

" V 6 R 6 E E G K R f R 0 L F E E R L R T I E fl U 

CCCTRTCGCGCCGGCGRGGRGCGCRflGCCCGflGCGCGflTCTTTtCGRGGflGCGCCTGCGCflCGRTflGfiGGCGGTG 

8285 8295 8305 8315 8325 8335 8315 8355 

W Q H 0 0 H R E H 0 L D S D D V V 0 F E G G n S 

GTGCRGRRCCRGGRCRRCCGCGRGCflCGRTCTGCTCGRCRGCGRCGRCTRCTRCCRGTTCGRRGGCGGCflTGRGC 

8360 8370 8380 8390 . 8100 8110 8120 8130 

rrreqlgghrfbi VHHDHSRPEKPU 
^^^T^C^^SCCGRRCRGCTCGGCGGTCflCCGTCCGGCGRTCTRCCRCRRCGRCCRTTCCCGTCCGGRflflflGCCTGTG 

8135 8115 8155 8165 8175 8185 8195 8505 

I RSLEE.E I GRU. URRRUONPICU I DGU 

RTCCGGTCGCTCGRRGRflGflGRTCGGCCGCGTGGTCCGGGCCCGCGTCGTCRRTCCCflRGTGGRTCGflTGGCGTC 

8510 8520 8530 8510 8550 8560 8570 8580 

HRHGVK GflF E I RRTU DVtlFRFRRTT 
-I.... •’^®^®*^^®^®‘*®^®‘^®®®®*»®®C®TTCGflGRTCGCT 6 CCflCGGTCGRCTRCflTGTTCGCCTTTGCCGC 6 flCCflCG 

®585 8595 8605 8615 8625 8635 8615 8655 

GRUROHHFERRV QRF I UDERURDFn 
®®T®‘^®®TGCGCGflCCflTCflTTTCGflGGCC 6 CTTflTCRG 6 CGTTCflTTGTCGflCGflGC 6 CGT 6 GCTCflCTTCRTG 

8660 8670 8680 8690 ' 8700 8710 8720 8730 

RDICHPRflFREt,cRERLLER I ORNLUT 
®®®®® 5 ®®®®®^*^^®®®^®^^ 3 TTGCC 6 nGCTT 6 CC 6 flflC 6 CCTGCTTGflfiGCflRTCGfiCCGCnflTCTCTC 6 fiCG 

8735 8715 8755 8765 8775 8785 8795 8805 

PRSNSARFELR-G I ctratrlrrgne 
^^®^^^^^^^^^^^®®C®CGGTTTG flflCTTGCCG 0 CflTC 6 GCRCGGCflGCflflCCCGCCTTCGTGCCG 6 CflflTGflfl 

8810 8820 6830 8810 8850 

» 

TAG 
8885 



8860 



8870 



8880 
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Sequence de 13144 pb 9034 a Oll^O nine eahfl 



9034 

9109 

9184 

9259 

9334 

9409 

9484 

9559 

9634 



DSDETTUGGER PnEIC DDnRHRtl iCnn 
RTGRGCGflCGRGflCGRCRGTRGGCGGCGflflGCCCCGGCCGRGRRGGflCGflTGCCCGCCflCGCCRTGflRGflTGGCG 

9044 9054 9064 9074 ’ 9084 9094 9104 

KKKflflR EIC in fl T tC T DEKGL I I UHTG 

RRGRflGRfiGGCflGCflCGCGRRRflOflTCRTCGCGRCGRRGftCCGflCGflGflRGGCTCTGRTCRTCGTCflRCflCCGGC 

9129 9139] ;; 9149 9159 9169 9179 

9 S T R G F G niFRHIRHGlIPCRU 

flflRGGCRfleGGCflRGTCGflCCGCCGGCTTCGGCRTGRTCTTCCaCCflTRTCGCCCflCGGCRTGCCCTGCCCCGTC 

9194 9204 9214 9224 9234 9244 9254 

'•QF • •^G flHRT 6EREL1E KHFGD0CQ 

GTGCRGTTCRTCRRGGGTGCGRTGGCRRCCCIGCGRGCGCGRGTTGRTCGRGRRGCRTTTCGGCGRTGTCTGCCRG 

9269 9279 9289 9299 9309 9319 9329 

^'^^'■®F 6 FT11 E T QDRRROURtlREKR 

TTCTRCRCGCTCGGCGRGGGCTTCRCCTGGGRRflCGCROGRTCGCGCCCGCGRTGTTGCGflTGGCTGflRflflGGCC 

9344 9354 9364 9374 9384 9394 9404 

“FKRKELIRDERHStl UL LDEIHIflL 
TGGGflCRflGGCGflflGGflflCTGRTCCGTGflCGflGCGCRRCTCGfltGGTGCTGCTCCflCGflGflTCflflCflTTCCTCTG 

9419 9429 9439 9449 9459 9469 9479 

"VDV I DUfiEO V R FLKEE^K P HnTH OU 

CGCTRCGflCTRCflTCGRCGTCGCCGRflGTGGTGCGCTTCCTGflflGGnflGRRflflGCCGCflCflTGflCGCflTGTGGTG 

9494 9504 9514 9524 9534 9544 9554 

l-T G RHflUEOL l E UflOLUT EIIEL I KH 

CTCRCCGGCCGCflflCGCGflRRGRRGflCCTGflTCGflflGTCGCCGRTCTCGTCflCTGflGflTGGfiGCTGflTCflRGCflT 

9569 9579 9589 9599 , 9609 9619 9629 

P F R S G I K fl Q 0 G- U E F • ' 

CCGTTCCGTTCCGGCRTCRRGGCGCRGCRGGGCGTGGRGTTCTGR 
9644 9654 9664 9674 
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no99e 


90 1 ecu 1 a 1 re (eoyenne) 


- 24027 


.6973 




INDEX OE POLRRITE (X) 
POINT ISOELECTRIQUE 
DO 260 (Isg/ftl) • . 0. 


413 00, 


47.66 

6.94 

280 (Ug/el) ■ 


0.612 
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PL. ml in 

Sequence NHa-lermlnale de la SUMT de M. ivanovll 

V VyLVG A BPGDPEL ITLKAVNVLK-ADVVL 
923 946 

Oligonucleotide sens 946 (27-mers) 

P G D P E L 

5’ C6CGG AATTC CCA GGA GAT CCA GAA CT 3’ 
EcoRI T T C T G 

C C C 

6 G G 

Oligonucleotide sens 923(27-mers) 

V V L V G A 

5‘ CGC6 GAATTC GTA TAT CTA 6TA GGA GC 3' 
EcoRI G C T T T 

6 

sequence NH 2 “terminale d'un fragment issu d'une 
digestion trypsique de la SUMT de M. Ivanovil 

IIT GTLEN IAGK 

947 

Oligonucleotide antisens 947 (25-mers) 

N E L T G 

5* CGCG AAGCTT GTT TTC TAG AGT ACC 3’ 

Hindlll A C A t T 

G C 




du biin codsnt enzymatique 



■Hiiiiiiiiiiiii yinede structure dele SUMT de.M.ivaiMvti 

FIGURE 48 



^ECIILLE dik RriutcM: «-i 
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Hind 



. AWh 

Eco 



Fragment de 615 pb 
^ apres digestion par EcoRI 



Hind 



Eco 



Hindlll 




Hind 



Eco 



Forme replicative 
recombinante 
pGlO 




ADN sb du phage pm 
recombmani ' 




Brlnd’ADN synthe 5’ 
tise Idrs de la reaction 
de sequence 



gSite d'hybridatipn du primer -20 de 
1‘ADN sb du phage M 1 3mp 1 9 
^Sequence compiementaire de 
I'oligonucleotide sens 946 



eriTM!,i i .e ner. offnarn , 
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PL. 144 (/j-j 



1 2 3 4 





FIGURE 50 



m 111 1 F nE 
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10 *20 , 30 
CCATAATTCT TTTATAATTT AAACG6TGAA 
GGTATTAAGA AAATATTAAA TTTGGCACTT 

70 80 90 

CCAGGAGATC CCGAACTTAT CACTCTCAAA 
GGTCCTCTAG GGCTTGAATA GTGAGAGTTT 

130 140 150 

GTACTGTACG ACAAACCTGC AAATGAAGAA 
CATGACATGC TGTTir-GACG TTTACTTCTT 

190 200 210 

ATATATGTCG GAAAACAA6C AGGACATCAT 
TATATACAGC CTTTTGTTCG TCCTG2^TA 

250 260 270 

CTTGTTGAAG AAGCAAAAGA AAATGATTTA 
GAACAACTTC TTCGTTTTCT THACEftAAT 

310 320 / 330 

GTATTTGGAA GAGGAGGCGA GGAAATTCTG 
CATAAACCTT CTCCTCCGCT C C TT TA AGAC 

370 380 390 

TTAGTTCCAG GGGTAACTTC TGCAATEGGA 
AATCAAGGTC CCCATTGAAG ACGTTAACCT 

430 440 450 

CATAGAGGTG TTGCAACATC GTTTACAGTT 
GTATCTCCAC AACGTTGTAG CAAATGTCAA 

490 500 510 

AAGAAACAGG TAGGAT6GGA CTTTAAAGCA 
TTCTTTGTCC ATCCTACCCT GAAATTTCGT 

550 560 570 

AATTTAGCTG AAAATACAGC AGAAATTATG 
TTAAATCGAC TTnATGTCG TCTITAATAC 

610 620 . 630 
GTAATTGAAA ATGGTACGAT GGAAGS3CAA 
CATTAACTTT TACCATGCIA CCTTCGAGTT 

670 680 690 

GCTGGAAAGG ATATTAAACC TCCTGCTTTA 
CGACCTTTCC TATAATTT6G AGGACgAm 

730 740 750 

AA GAAA TGAA TCAAATCAGT GGCTGATCIA 
TTCTTTACTT AGTTTAGTCA GCGACIAGAT 

790 800 810 

AGGTAAAAAA ATTGTTATAA CAAGACCTGC 
TCCATTTTTT TAACAATATT GTTGTGGACG 

850 860 870 

AAAA TCTTAT GGAGCAGTTC CAATTGTAAC 
TTTTAGAArA CCTCGTCAAG GTTAACATTG 

910 920 930 

AGAAGAAGTG ATAAAATlAT GTAATATGRT 
TCTTCTTCAC TATTTTAATA CATTATACTA 



• PLTI9S'/^N I 

40 50 60 

CACAT66TAG TT4ATTIAGT AGGTGCGGGT 
GTGIACCATC AAATAAATCA TCCACGCCCA 

100 110 120 
GCTGTAAACG TGTTAAAftAA AGCGGATGTT 
CGACATTTGC ACAATTTTTT TCGCCTACAA 

160 170 180 

ATTTTAAAGT ATGCTGAAGG TGCAAAACTA 
TAAAATTTCA TACGACTTCC ACGTTTTGAT 

220 230 240 

TAO^TCTC AAAATGAAAT CAATACTCTT 
ATGlTTAGAG TTTIACTTTA GTTATGAGAA 

280 290 300 

GIAqiACGCC TTAAAG6TGG AGACCCCTTT 
CATCATGCGG AATTTCCACC TCTGGGGAAA 

340 350 360 

GCCCTTCTAG AAGAAGGAAT TGATTTTGAG 
CGGGAACATC TTCTTCCTTA ACTAAAACTC 

400 410 420 

GTTCCAACAA CAATTGGGCT TCCAGTTACT 
CRAGGTTGTT GTTAACCCGA AGGTCAATGA 

460 470 480 

GTTACAGGTC ATGAAGACCC AACAAAATGC 
CAATGTCCAG TACTTCTGGG TTGTTTTACG 

520 530 540 

GATACTATTG TAATACTTAT 6SGTATTGGA 
CTATGAXAAC ATTATGAATA CCCATAACCT 

580 590 600 

AAA CAT AAA G ATCCTGAAAC TCCAGTTTGT 
TTTGTATTTC TAGGACTTTG AGGTCAAACA 

640 650 660 

AGGATAATAA CGGGCACACT GGAAAATATA 
TCCIATTATT 6CCCGTGTGA CCTTTT A TAT 

700 710 720 

GTGGTATTGG AAATGTTGTC AATGTTTTTA 
CACCA|!AACC TTTACAACAG TTACAAAAAT 

760 770 780 

TZAAGAAG6C AATATCATGA AT6GATTAGA 
AATTCTTCCG TTATAGTACT TACCTAATCT 

820 830 840 

T GAAA GGGCT AAAGACTCAG TTGAAATGGT 
ACTTTCCCGA TTTCTGAGTC AACTTTACCA 

880 890 900 

TCCTACAATT GAACTCAAAG ATTCCAAGCC 
AGGATGTTAA CTTGAGTTTC TAAGGTTCGG 

940 950 960 

aaatg?Acct TGATTGGCCT TATAT 

TTIACWSGA ACTAACCGGA A3ATA 



FIGURE 51 



FEUILLE DE HEWPI-ASEMEWT 
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PL. 14S f if \ 

GENE COrA ET PROTEINE CORA (SUMT) DE METHANOBACTERUJM 
IVANOVII 

SEQUENCE DU FRA(31ENT DE 955 PB DE 34 A 729 

H V V Y L VGAGP GDPELI .TtKAVNVLK 

ATGGTAGTTTATTTAGTAGGTGCGGGTCCAGGAGATCCCGAACTTATCACTCTCAAAGCTGTAAACGTGTTAAAA 

34 44 54 64 74 84 94 104 

KADVVIiYD K PANEE 1 LKYAEGAKL I 
^ ft^^®^®*^^^^^^^'^^®“^*^®^^*^^^^^'®^^^^YGAAGAAATTTTAAAGTATGCTGAAGGTGCAAAACTAAIA 

109 119 129 = 139 149 159 169 179 

YVGKQA GHHY.'K'SQ NE INTIiLVEEAK 
»TGTCGG^CAAGCA^CATCAItfeAAATCTC^T6AAATC^^ 

1®^ 19« 204 214 224 .! 234 244 254 

^ ^ ^ ^ VVRLKG GD P F VP G'RGGEE I LA 

GAAAATGATOAGTAGTACGCCTTAAAGGTGGAGACCCCTTTGIATTTGGAAGAGGAGGCGAGGAAATTCrGGCC 

259 269 279 2B9 299 309 319 329 

L V E E G X D F E L V P G V T S A I G V P T T I G 

cttgxagaa^ggaattgattttgagttagttccaggggtaacttctgcaattggagttccaacaacaattggg 

34 344 354 ..,364 374 384 394 404 

LPVTHRGVATSF;TVVTGHEDPTKCK 

CTTCCAGTTACTCATAGAGGTGTTGCAACATCGTTTACAGTTGTTACAGGTCATGAAGACCCAACAAAATGCAAG 

409 419 429 439 449 459 469 479 

KQV GWDF KA .;D T I V ILMGIGNLAENT 
^CAGGTA^TGGGACmAAAGCAGS^AGTATTGTAATACTTATGGGTATTGGAAATTTAGCTGAAAATACA 

“4 494 504 514 524 534 544 554 

AEIMKHKDRE TPVC VIENGTMEGOR 
^GAAATTApUACATAAAGATCCTGAAACTCCAGTTTGTGTAATTGAAAATGGTACGATGGAAGGTC^GG 

539 569 579 589 599 609 619 629 

IITGTLENIAGKD IKPPALVVLEML 
ATAATAACGGGCACACTG6AAAATATAGCTGGAAAG6ATATTAAACCTCCTGCTTTAGTGGTATTGGAAATGTTG 

534 644 654 664 674 684 694 704 

S M F L K K * 

TCAATGTTTTTAAAGAAATGA 
709 719 729 



334 



484 



FIGURE 52 
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PROTEINS CORA 

1 PHE F 


NCXIBRE 

6 


% NC»1B 
2.60 


POIDS % POIDS 
882.41 3.54 


2 


LEU 


L 


22 


9.52 


2487.85 


9.99 


3 


ILE 


I 


17 


7.36 


1922 „43 


7.72 


4 


MET 


M 


6 


2.60 


786:24 


3.16 


5 


VAL 


V 


26 


11.26 


2575.78 


10.34 


6 


SER 


S 


4 


1.73^ 


348.13 


1.40 


7 


PRO 


P 


12 


5.19 


1164.63 


4.68 


8 


THR 


T 


16 


6.93 


1616.76 


6.49 


9 


ALA 


A 


16 


’ 6.93 ’ 


1136.59 


4.56 


10 


TYR 


Y 


5 


2.16- 


815.32 


3.27 


11 


★ 


* 


0 


0.00 


0.00 


0.00 


12 


HIS 


H 


• 5 


2.16 


685.29 


2.75 


13 


GLN 


Q 


4 


1.73 


512.23 


2.06 


14 


ASN 


N 


9 


3.90 


" 1026.39 


4.12 


15 


LYS 


K 


20 


8.66 


2561.90 


: 10.29 


16 


ASP 


D 


11 


4.76 


1265.30 


= 5.08 


17 


GLU 


E 


21 


9.09 


2709.89 


10.88 


18 


CYS 


C 


2 


0.87 


? 206.02 


0.83 


19 


TRP 


W 


1 


0.43 


186.08 


0.75 


20 


ARG 


R 


4 


1.73 


624.40 


2.51 


21 


GLY 


G 


24 


10.39 


1368.52 


5.50 


22 


- 


- 


0 


0.00 


0.00 


0.00 



RESIDUS =231 

Masse moleculalre (monolsotoplque) = 24900.1855 

Masse moleculalre (moyenne) = 24915.9766 

INDEX DE POLARITE (%) = ’ 40.69 

POINT ISOELECTRIQUE . = S.45 

DO 260 (Img/ml) = 0.304 DO 280 (Img/ml) = 0.462 
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FIGURE 52 a 
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PL. 



CORR D£ PREtItER RESIDU=1 

DERNIER RESIDU=231 




23 46 69 9ii 115 138 161 184 207 230 



FIGURE 52.3 
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M. IVMKSVll CORA 3 A 227 

P. DENITRIFICANS COBA 17 A 251 






10 20 30 40 ■ 50 60 70 

VYLVGAGPGDPELITLKAVNVLKKADWLYDKPANEEILKYAE-GAKLiYVGKQAGHHYKSQNEINTLLV 



VnLVGAGPGDPGLLTLHAANALRQADVIVHDALVNEDCLKLARPGAVLEFAGKRGGKPSPKQRDISLRLV 

20 30 40 50 60 70 80 

80 90 100 110 12D 130 140 

EEAKEKDLWRLKGGDPFVFGRGGEEILALVEEGIDFELVPGVTSAIGVPTTIGLPVTHRGVATSFTWT 



ELARAGNRVLRLKGGDPFVFGRGGEEALTLVEHQVPFRIVPGITAGIGGLAYAGIPVTHREVNHAVTFLT 
90 100 no 120 130 140 150 

150 160 170 .180 190 200 

GHEDPTKCKKQVGWD-FKADT-IVIL-MGIGNIjAENTAEIMKH-KDPETPVCVIENGTMEGQRIITGTL- 

GHDSSGLVPDRINWQGIASGSPVIVMYMAMKHIGAITAi&IAGGRSPDEPVAFVCNAATPQQAVLETTLA 
160 170 180 190 200 210 220 

210 220 

— E-NIAGKDIKPPALWL-EMLSM 



RAEADVAAAGLEPPAIVWGEWRL 
230 240 250 



POURCENTAGE D'H(M)LOGIE STRICTE : 40.4 



FIGURE 53 
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45b /45T1 



PXL1809 
6 kb 



digestions ind6pendantes de pXL694 
par EcoRI-Ndel et EcoRl-Sstl 
purification du fragment EcoRi-Ndei de 
^120 pb et du fragment EcoRl-Ssti de 3.1 kb 



ligature et 
transformation 
dans MCI 060 



amplification enzymatique avec 
les oligonucleotides 
I277et 1278 
digestion par Ndei-Sstl 
purification du fragment 
ampHfi^ de 900 pb 



/Kpnl 
^Xhol 
Sail 
Clai 
Hindlll 
EcoRV 
EcoRI > 



KBamHi) 

Spel 

Xbai 

Notl 

Ssti 




pCT230 ^ ' 

IZIcb 



digestion totale de pXL1832 par EcoRI 
et part ielle par BamHl 

purification de la cassette d’expresslon 
EcoRI-BamHI-BamHIde I.Skb'- 



digestlon de pKT230 
par BamHl et EcoRI 



ligature et 
transformation 



. EmRI 
\ HMIlli 



Ptrp 

RBS 

PXL1841 



■■■ g§ne cor A de Methanobacterium ivanovii 

E2S3 region terminatrice de Toperon rrnB de E. coli 
nnjpnn cDNA de rangtogenine humaine 
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tableau: pucification de la cobinamide klnase-cobinamlde phosphate guanylyltransfecase de Pseudoeonas 
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